Computação – Química, Bioquímica e Biofísica Computacionais

Aprendizagem de máquina para (bio)moléculas

Biofísica Molecular, Bioquímica, Ciência, Computação, Internal

A explosão de novos métodos em aprendizado de máquina (machine learning, ML) e redes neurais (neural networks, NN) também trouxe avanços para pequisa molecular. Veja abaixo algumas boas referências e tutoriais:

Curso online do Andrew White, cobrindo várias técnicas e com exemplos em Jupyter par aplicações moleculares;
Campos de força foram montados com ML aqui ou aqui. Quem quiser se aventurar, pode começar com esta biblioteca em Python, que também apresenta bons tutoriais sobre ML.
Esta série de aulas online apresentadas pelo Frank Noé, pesquisador com relevantes contribuições no campo de simulação molecular, é uma boa introdução à ML, com conceitos formais e exemplos paupáveis.
Algumas aplicações de ML em química medicinal, com notebooks e exemplos.
Esta outra série que decodifica o AlphaFold 2 também é uma rápida e ótima introdução a redes neurais aplicadas para biomoléculas.
Listagem de papers compreensiva sobre desenho de proteínas com Deep Learning.
Notebooks para desenho de proteínas com Deep Learning.

Arquitetura e performance de computadores e software

Computação, Internal

Entrada para agrupar textos recomendados sobre arquitetura de computadores e clusters, e desenho de software para computação científica:

Textos clássicos:
- Talvez o texto inicial mais fundamental aqui é In Search of Clusters do Gregory Pfister (2a edição), que apresenta vários conceitos de arquitetura de computadores (cache, memoria virtual, etc) numa linguagem bastante acessível;
- Um livro mais focado em hardware e desenho de microprocessadores é o Computer Organization and Design de Patterson & Hennessy. Este é de leitura mais difícil, com foco em engenheiros;
- Sobre software, recomendo o livro Sistemas Operacionais Modernos do Tanenbaum, que introduz conceitos como gerenciamento de memória, etc.
- Um livro bastante completo sobre métodos numéricos e implementações de seus algoritmos é o Matrix Computations de Golub & Van Loan. Veja mais sobre métodos numéricos nesta postagem.

Temos cópias de todos esses livros no laboratório.

Textos atuais:
- Blog HPC notes;
- Esta recente revisão aborda avanços no desenvolvimento de algorítmos mais eficientes e deixa uma perspectiva da computação científica nos anos 2020. Esta outra revisão do Mark Gordon foca no reflexo destes desenvolvimentos em códigos de química computacional;
- David Shaw sobre o desenho do computador Anton e reportagem sobre suas novas gerações;
- Revisão sobre desenvolvimento de chips ARM e novos sistemas de computação de alto-desempenho (HPC), com infos sobre as empresas envolvidas.
- Artigo sobre evolução de chips GPU (NVidia) e a divergência entre aplicações em AI e HPC

Protegido: Sistema de filas – PBSPro

Computação, Manual

Programas científicos são diferentes de equipamentos de laboratório

Blog, Computação

Interessante postagem e artigo do Konrad Hinsen sobre reproducibilidade de pesquisa computacional. Sua discussão, um tanto epistemológica, atualiza a idéia bem disseminada que ciência é baseada em dois pilares, experimento e teoria. Hinsen prefere dizer que observações e modelos, são os verdadeiros pilares e, portanto, simulação computacional é apenas um experimento com modelos. Leia a postagem completa aqui.

Métodos numéricos, estatísticos e de aprendizagem de máquina

Computação, Internal, Manual

Nesta postagem vou tentar agrupar algumas boas referências sobre áreas de métodos numéricos (álgebra linear, primeiro bloco abaixo), estatística (segundo bloco) e aprendizado de máquina (machine learning, ML – terceiro bloco – apenas métodos matemáticos estão aqui incluídos. Veja aqui para ML aplicado métodos físicos ou a moléculas.):

Uma das referências fundamentias sobre métodos numéricos é o livro Matrix Computations de Golub e van Loan. Temos uma cópia no lab, e tenho a última (4a) versão se alguém tiver interesse;
Uma boa referência sobre métodos numéricos de otimização e a álgebra linear associada é o livro Practical Optimization;
Boa revisão e tutorial sobre Algebra linear em Python;
Excelentes explicações gráficas de Algebra linear e transformações matriciais;
Curso de Algebra Linear do MIT;
Singular-value decomposition (SVD). Método similar a análise espectral (autovetores), de crescente importância para redução de dimensionalidade e interpretação de dados multi-dimensionais. Por exemplo, é aplicado para justificar métodos de renormalização de grupo (como DMRG);
Texto pedagógico sobre transformada de Legendre, muito usada para expressão de quantidades termodinâmicas e relações em mecânica estatística.

Introdução didática sobre o procedimento de bootsrap usado para estimar erros padrão e intervalos de confiança; Críticas sobre esta metodologia.
Web-site com tutoriais, dicionários e explicações sobre diversos conceitos de estatística;
Inferência Bayesiana é de grande importância em biofísica, para comparação de dados simulados e experimentais;
Coleção de vários tutoriais úteis em Bioinformática.

Referência básica sobre ML: Livro dos Bishops, bastante completo e detalhado.
Machine-Learning University: Vários tópicos relacionados (desde regressão linear), com gráficos e explicações claras.
Curso online da Universidade de Amsterdam sobre Deep Learning usando PyTorch e com notebooks com exemplos.
Curso prático com notebooks sobre Deep Learning.
Guia ilustrado sobre arquitetura de Transformers.

Category Archives: Computação

Aprendizagem de máquina para (bio)moléculas

Arquitetura e performance de computadores e software

Protegido: Sistema de filas – PBSPro

Programas científicos são diferentes de equipamentos de laboratório

Métodos numéricos, estatísticos e de aprendizagem de máquina

Reproducibilidade em pesquisa computacional

Protegido: Formatação e impressão de textos e documentos

Protegido: Course material

Protegido: Programas ou páginas úteis

Protegido: C, a linguagem de programação

Protegido: Python

Protegido: Sistema de filas – TORQUE

Protegido: O que é simulação computacional?

Protegido: Linux