A primeira mini-escola paulistana de inteligência artificial e simulação computacional de biomoléculas foi organizada pelo Laboratório de Bioquímica e Biofísica Computacionais como um curso introdutório com ênfase em aulas práticas.
Data e horário: 24, 25 e 26/Julho/2024 (quarta à sexta-feira), manhã e tarde.
Local: Instituto de Química (IQ-USP), presencialmente no Laboratório de Bioquímica e Biofísica Computacionais, sala 752, bloco 7 superior.
Conteúdo:
- Pré-requisitos:
- Interações moleculares: Texto extraído de VanHolden et al.
- Estrutura de biomoléculas. Slides de revisão (G.M. Arantes)
- PDB: Banco de dados de estrutura de proteínas. Revisão sobre seu formato
- Introdução conceitual à física estatística de biomoléculas (D.M. Zuckerman)
- Guia Foca Linux : Veja o nível “iniciante + intermediário” para introdução sobre Linux
- Interpretadores e Python:
- Slides de aula e scripts em BASH e Jupyter (L. Ducati)
- Slides pythonBasics
- iPython, Jupyter e Google Colab: Consoles interativos e cadernos de notas em Python
- Tutorials Point: Guia acessível com comandos e sintaxe básica de Python
- Livro texto: A Whirlwind Tour of Python por J. VanderPlas. Notebook no Google Colab
- (*) Bibliotecas científicas: Python Data Science Handbook por J. VanderPlas
- Simulações baseadas em energia e estrutura molecular:
- Slides de aula: Modelos de energia (G.M. Arantes)
- Slides de aula: Exploração de superfícies (G. M. Arantes)
- Visualização molecular (formatos PDB, XYZ, etc.): PyMol, VMD, Molden, JMol
- Livro texto: A Practical Introduction to the Simulation of Molecular Systems, Martin J. Field, 2a. edição, 2007 [Amazon US, CUP]
- Biblioteca pDynamo. Notebook do pDynamo3 pelo Google Colab
- Notas eletrônicas dos termos energéticos em mecânica molecular (MM) e sua origem física
- Pacote GROMACS para dinâmica molecular:
- Tutorial para simulação de proteina em água (J. Lemkul)
- Manual online;
- Canal do BioExcel : Muitos vídeos e tutoriais
- (*) CHARMM-GUI : Interface gráfica e online bastante útil para gerar topologias de MM
- Introdução a Machine Learning (ML):
- Livros e tutoriais:
- (*) Practical Optimization por Gill, Murray & Wright. Clássico sobre métodos numéricos, otimização e álgebra linear
- Introdução à álgebra linear aplicada a ML com exemplos em Python (P. Caceres)
- Deep Learning, por Bishop & Bishop, bastante completo e detalhado
- Machine-Learning University, com gráficos e explicações claras
- Deep learning para moléculas e materiais (A. White)
- Bibliotecas:
- scikit-learn: classificação, regressão, clusterização, etc…
- (*) Guia ilustrado sobre estruturas algébricas em ML
- Livros e tutoriais:
- Simulações e inferência baseadas em informação:
- Slides de aula (S. Ovchinnikov)
- Uniprot: Banco de dados de sequencias de proteínas, completo e anotado
- BLAST (Basic Local Alignment Search Tool): Alinha e encontra sequências similares
- Weblogo: Gráfico da conservação de sequências. Logomaker (em Python)
- Implementação “original” do AlphaFold2 no GoogleColab (DeepMind)
- ColabFold e outros notebooks para proteínas
- ESMFold: Modelo de linguagem para enovelamento (Facebook AI Research)
- (*) Coleção de ferramentas de ML para determinar estruturas de proteínas
- (*) Listagem de papers sobre ML para proteínas
- (*) Arquitetura do AlphaFold3 ilustrada
Programa:
- Breve introdução a interpretadores de comandos: Python e notebooks Jupyter;
- Simulações baseadas em energia e estrutura molecular: Métodos clássicos e quânticos;
- Exploração de híper-superfícies. Prática de simulação de dinâmica molecular;
- Introdução a Machine Learning. Redes Neurais;
- Simulações e inferência baseadas em informação. Prática com AlphaFold e modelos de linguagem de proteínas.
Palestrantes:
- Prof. Guilherme M. Arantes (IQ-USP)
- Prof. Luis Gustavo Dias (FFCL-USP/RP)
- Prof. Lucas Ducati (IQ-USP)