Aprendizagem de máquina para (bio)moléculas

A explosão de novos métodos em aprendizado de máquina (machine learning, ML) e redes neurais (neural networks, NN) também trouxe avanços para pequisa molecular. Veja abaixo algumas boas referências e tutoriais:

Introdução aos potenciais híbridos QM/MM – online

Segue uma breve introdução teórica e prática, utilizando a biblioteca pDynamo:

Vídeos de aulas e palestras

Com a pandemia de Covid-19 e o distanciamento social, gravamos e publicamos em meio digital diversas aulas e palestras científicas. Vejam abaixo alguns destes vídeos:

Arquitetura e performance de computadores e software

Entrada para agrupar textos recomendados sobre arquitetura de computadores e clusters, e desenho de software para computação científica:

  • Textos clássicos:
    • Talvez o texto inicial mais fundamental aqui é In Search of Clusters do Gregory Pfister (2a edição), que apresenta vários conceitos de arquitetura de computadores (cache, memoria virtual, etc) numa linguagem bastante acessível;
    • Um livro mais focado em hardware e desenho de microprocessadores é o Computer Organization and Design de Patterson & Hennessy. Este é de leitura mais difícil, com foco em engenheiros;
    • Sobre software, recomendo o livro Sistemas Operacionais Modernos do Tanenbaum, que introduz conceitos como gerenciamento de memória, etc.
    • Um livro bastante completo sobre métodos numéricos e implementações de seus algoritmos é o Matrix Computations de  Golub & Van Loan. Veja mais sobre métodos numéricos nesta postagem.

Temos cópias de todos esses livros no laboratório.


Informação e tecnologia quântica molecular

Embora mecânica quântica seja quase que trivialmente usada para descrever a estrutura eletrônica de moleculas e até processos biológicos de transferência de carga e energia, a construção de novos dispositivos tecnológicos baseados em informação quântica é uma nova e excitante fronteira de pesquisa que pretendemos explorar no laboratório usando síntese bioquímica e propriedades de spin de metais de transição. Vejam abaixo algumas referências informa/inspiradoras:

  • Papo de físico: Talvez o melhor livro para introdução aos fenômenos associados à informação quântica é The Quantum Challenge do George Greenstein e Arthur Zajonc. Tenho uma cópia em minha sala se alguém estiver interessado. Além de apresesentar (ou revisar) conceitos de mecânica quântica até computação quântica de forma bastante didática, há um apêndice sugerindo como montar experimentos quânticos simples, que deixam com vontade de debruçar numa bancada!
  • Curso introdutório recente (2018) sobre computação quântica no IFT-ICTP (aqui em SP). Veja os slides na aba “Files”. Revisão de 1998 com princípios básicos. Aulas online do John Preskill, um dos pioneiros da área, para curso de Quantum Computation em Caltech, EUA;
  • Daqui pra baixo já é papo de físico-químico: Podemos aplicar computadores quânticos (pelo menos a sua lógica, já que os primeiros hardwares ainda são desenvolvidos) para cálculos de química quântica. Esta revisão mostra como cálculos moleculares como HF, CC, etc podem ser realizados. A biblioteca OpenFermion é usada para interfaciar problemas (e programas como o PySCF) da química quântica com algoritmos e computadores quânticos.
  • O fenômeno da teleportação quântica foi recentemente observado em moléculas fotoativadas. Seria possível construir um dispositivo semelhante com metaloproteínas? Como podemos simular estes processos?
  • Esta revisão mostra como dispositivos moleculares podem ser sintetizados e testados em busca de propriedades como emaranhamento e lenta decorrelação, e para construções ou realizações de bits quânticos (qubits).
  • Elegante artigo do sambista e nobelista Roald Hoffmann mostra como conceitos simples em química orgânica e estrutura eletrônica podem explicar um comportamento complexo de intereferência na condutância molecular. A linguagem e a organização do artigo também são bastante peculiares e uma assinatura do autor.

Transferência de elétrons: Não-adiabática, PCET e outros bichos…

Outro termo da moda e abusado na literatura, PCET possui várias definições e mecanismos. Veja algumas referências para navegar neste assunto:

Tratamento moderno da correlação forte: DMGR, MPS e afins

Postagem sobre métodos modernos para cálculo de sistemas quânticos envolvendo emaranhamento ou correlação forte. Agregados de ferro-enxofre ou complexos polinucleares de metais de transição são exemplos moleculares cuja estrutura eletrônica tem considerável correlação forte.

Sugestões são sempre bem vindas (veja seção de comentários abaixo)!

 

Referências:

  • Orus 2014: Revisão mais didática (errr, na medida do possível para um assunto tão novo e complexo :-);
  • Schollwock 2005: Referência clássica (um tanto indigesta) no principal periódico de revisões em física;
  • Chan 12: Mini-revisão sobre vários tipos de MPS;
  • Chan 15: Talvez a melhor introdução ou revisão prática de DMRG aplicada a cálculos moleculares;
  • Chan 16: Escrita pelo Garnet Chan com o S. White (o pai do DMRG), com objetivo de conectar as linguagens de DMRG e MPS. Talvez a Introdução seja uma boa leitura inicial;
  • Sem relação conceitual com DMRG, métodos estocásticos, como o método SHCI, também são alternativas promissoras para cálculo de sistemas moleculares fortemente correlacionados;
  • Singular-Value Decomposition (SVD): Wikipedia;
  • Decomposição de Schmidt: Wikipedia; Notem que este matemático foi aluno do David Hilbert e desenvolveu vários métodos úteis em mecânica quântica, como a ortogonalização Gram-Schmidt;
  • Tensores: Uma busca simples no Google, por exemplo pela expressão “introduction tensor algebra”, já dá boas indicações. Em particular, achei interessantes estas introduções por Dullemond & Peeters e o primeiro capítulo do B. Porat.
  • Representações tensoriais também tem diversas aplicações em química quântica, como didaticamente apresentado aqui pelo D. Crawford;

Cursos e Tutoriais:

Programas:

  • Block: Além de programa strandalone, também esta (em parte) implementado junto do ORCA (versões 3 e 4). Ambos estão instalados no nosso cluster fragile. Se tiver interesse em rodar alguma computação, pode tentar brincar ou começar com o ORCA usando sistemas simples, tipo H2 com distância longa, ou C2 e os sistemas teste usados no artigo do Chan 15. Só depois tente algum sistema complexo ou partir para o PySCF;
  • PySCF: Faz vários tipos de contas de química quântica e funciona como uma interface em Python. Embora não faça cálculos de DMRG ou MPS, é uma interface para rodar ORCA e afins;
  • ITensor: Programa para expressar diagramas de redes tensoriais e variações de MPS. Sua grande vantagem é acompanhar os índices automaticamente, liberando esta responsabilidade do usuário. Talvez seja ineficiente para cálculos moleculares de alta precisão (como DMRG comparando com o BLOCK), mas pode servir como uma ferramenta para aprendizado e para gerar modelos aproximados. Esta revisão descreve o ITensor detalhadamente.

Curiosidades:

  • Artigo do M. Reiher et al. propondo justamente a estrutura eletrônica de agregados de ferro-enxofre como possível aplicação para demonstrar a supremacia de computadores quânticos;
  • Veja mais sobre computação quântica em problemas de estrutura eletrônica fortemente correlacionada nesta revisão e talvez nesta outra, ambas do Aspuru-Guzik;
  • Palestra do Ali Alavi no CECAM, sobre métodos estocásticos (QMC) para tratamento do mesmo problema de estrutura eletrônica fortemente correlacionada, mas sem computadores quânticos e sem DMRG. Notem que por volta de 35 minutos, ele vai confiantemente dar uma demonstração que termina em NaNs… :-)
  • Workshop online em 2021 sobre uso de computadores quânticos em química quântica;

Mecanismos moleculares e energéticos da Fotossíntese

A referência fundamental para se começar a compreender os processos moleculares e as proteínas envolvidos na absorção de energia luminosa e sua transdução para energia química em sistemas biológicos, também chamada de Fotossíntese, é o livro do R. Blankenship, Molecular Mechanisms of Photosynthesis. Tenho uma cópia para emprestar aos interessados. Seguem outros artigos interessantes:

  • Estrutura da desidrogenase NDH fotossintética e oxigênica. Como é relacionada/homóloga ao complexo respiratório I, ambas devem ter mecanismos semelhantes para entrada de Q/PQ e para acoplamento redox com bombeamento de prótons;
  • Revisão sobre efeitos quânticos, principalmente coerência, para separação de carga: Romero 2017;
  • Outra revisão sobre coerência quântica, além de sistemas biológicos: Scholes 2017;
  • Experimentos com XFEL mostram a evolução temporal da densidade eletrônica e, portanto, o mecanismo reativo, nos centros reativos (Mn4O4Ca) e quinonas do Fotossistema II.

Simulação de membranas e proteínas embebidas

Agrupamento de informações e links sobre simulação por mecânica molecular de membranas e proteínas associadas.

Montagem e inserção:

  • MemGen servidor para gerar geometrias e topologias;
  • O servidor Charmm-GUI também funciona, com diversas composições membranares;
  • Atualmente o melhor método para inserção de proteínas e solutos em membranas é o da pressão lateral, proposto por Javanainen em 2014;

Cuidados e dicas:

  • PMFs de inserção devem usar uma coordenada de reação (CR) com geometria cilíndrica, para corrigir efeitos de ondulações da membrana. Mas, cuidado! Na minha recente experiência, o uso da geometria cilíndrica apresenta outros problemas como violações da posição da molécula inserida, mesmo respeitando a CR. Este comportamento deve ser investigado no futuro;
  • Sempre conferir as janelas de US se houve algum flip-flop de lipídeo;
  • Cuidado com o tamanho da caixa e a definição da CR. Podem acontecer mudanças de posição relativa, mesmo respeitanto a CR, por causa das condições periódicas (PBC);

Referências:

 

Métodos numéricos, estatísticos e de aprendizagem de máquina

Nesta postagem vou tentar agrupar algumas boas referências sobre áreas de métodos numéricos (álgebra linear, primeiro bloco abaixo), estatística (segundo bloco) e aprendizado de máquina (machine learning, ML – terceiro bloco – apenas métodos matemáticos estão aqui incluídos. Veja aqui para ML aplicado métodos físicos ou a moléculas.):

  • Uma das referências fundamentias sobre métodos numéricos é o livro Matrix Computations de Golub e van Loan. Temos uma cópia no lab, e tenho a última (4a) versão se alguém tiver interesse;
  • Uma boa referência sobre métodos numéricos de otimização e a álgebra linear associada é o livro Practical Optimization;
  • Boa revisão e tutorial sobre Algebra linear em Python;
  • Singular-value decomposition (SVD). Método similar a análise espectral (autovetores), de crescente importância para redução de dimensionalidade e interpretação de dados multi-dimensionais. Por exemplo, é aplicado para justificar métodos de renormalização de grupo (como DMRG);
  • Texto pedagógico sobre transformada de Legendre, muito usada para expressão de quantidades termodinâmicas e relações em mecânica estatística.

  • Introdução didática sobre o procedimento de bootsrap usado para estimar erros padrão e intervalos de confiança; Críticas sobre esta metodologia.
  • Web-site com tutoriais, dicionários e explicações sobre diversos conceitos de estatística;
  • Inferência Bayesiana é de grande importância em biofísica, para comparação de dados simulados e experimentais;

Outras proteínas de Ferro-enxofre e metaloenzimas

Postagem para reunir artigos e referências sobre metaloenzimas com sítios polinucleares e proteínas de ferro-enxofre, além dos casos especiais da cadeia de transporte de elétrons mitocondrial, fotossíntese, etc.

  • A evolução e conservação de diversos módulos proteicos em metaloproteínas é estudada neste artigo. Pode servir como ponto de partida para escolha de uma região quântica em um cálculo QC/MM ou para o desenho de novas metaloenzimas.
  • Diversas fosfatases tem atividade dependente de pares de íons de ferro. Um exemplo interessante é esta PhoX. Seu mecanismo pode ser investigado por simulações híbridas e comparado com as fosfatases ácidas-roxas;
  • Hidrogenase [NiFe] com diversos cluster FeS, alguns com geometria alternativa (não cuboidal), flavina e até proposta de bifurcação da transferência eletrônica. Outro lindo desafio para simulação! A estrutura foi determinada pelo mesmo grupo de pesquisa do trabalho abaixo (enzima com 46 centros de FeS). Mas, cuidado: as geometrias alternativas podem ser artefato da incidência destrutiva de raios-X sobre o centros metálicos…
  • Para quem ficou impressionado (eu fiquei!) com o “cabo” de 7 a 9 clusters de [FeS] presente no Complexo I, vejam esta enzima com 46 clusters [FeS]! A estrutura contém outras curiosidades como metais de tungstênio, canais para transporte de gases e hidratados, e grupos prostéticos incomuns! Alguém maluco o suficiente para modelar esta belezinha???
  • Estruturas cristalográficas de resolução ultra-aumentada permitem a “observação” de átomos de hidrogênio, pares eletrônicos e até, pasmen, densidade de carga de orbitais de fronteira de metais de transição. Vejam este artigo descrevendo uma proteína de [4Fe-4S] com resolução de 0.48 angstroms! Alguém interessado em construir um modelo híbrido QC/MM para esta proteína e verificar a precisão dos cálculos na reprodução da densidade de carga?
  • Alguns organismos não possuem proteínas funcionais especializadas para armazenagem intracelular de ferro, comoa ferritina. Livre em solução, este metal é tóxico, como pode-se imaginar do seu comportamento redox. A solução encontrada nestes casos é estocar grandes agregados de ferro, com até 20 mil átomos!

Desenho de proteínas

Temos aqui uma entrada para agrupar artigos interessantes sobre desenho de proteínas:

  • Artigo que inspirou esta postagem: Revisão do David Baker na Nature, 2016;
  • Vídeo de palestra do David Baker sobre desenho de proteínas para diagnóstico e tratamento do SARS-CoV2;
  • A expressão heteróloga e, portanto, a evolução dirigida de metaloproteínas é complexa. Este artigo apresenta uma interessante solução experimental. Este outro artigo apresenta outra solução;
  • Este artigo mostra um interessante aumento de promiscuidade catalítica por excitação eletrônica dos cofatores envolvidos. Veja também o comentário no final do artigo;
  • Boa mini-revisão introdutória sobre os avanços iniciais no desenho computacional de enzimas;
  • Outra mini-revisão, com enfoque histórico sobre importantes contribuições neste campo;

Citocromo bc1 e ciclo-Q

O mecanismo redox no citocromo bc1 (Complexo III mitocondrial), chamado de ciclo-Q, já foi bastante estudado, embora continue ainda discutido e fruto de especulação. Veja abaixo alguns artigos interessantes nesta discussão:

  • Interessante sistema modelo com várias propriedades medidas, útil para testar métodos de simulação para o sítio Qo. Mas a presença de Ru e ligante bipiridina pode ser um desafio: Kramer 2005;
  • Complexo III como um barramento eletrônico-molecular: Dutton & Osyczka 2010
  • Revisão sobre estrutura proteica e reatividade do ciclo Q: Cramer 2011;
  • Revisão atual sobre estruturas cristalográficas: Xia 2013;
  • Restrições termodinâmicas e evolução dos potenciais redox no ciclo-Q em diferentes organismos: Baymann 2016;
  • Identificação de resíduos envolvidos no transporte de H+ no sítio Qo: Daldal 2016;
  • Simulações mais recentes do mecanismo de reação no sítio Qo: Solovyov 2016;
  • Comparação de diversos métodos de cálculo de estrutura eletrônica para determinar a afinidade eletrônica de quinonas: Pantazis 2018;
  • Condições termodinâmicas para prevenir curto-circuito na transferência eletrônica bifurcada (2 elétrons) no ciclo-Q;
  • Revisão autobiográfica do Anthony Crofts sobre sua vida e resultados de pesquisas no citocromo bc1.

Qual o mecanismo de ação de proteínas anti-congelamento?

Diversas proteínas são conhecidas desde os anos 1960 como inibidoras da formação de cristais de gelo em água. Suas estruturas terciárias são diferentes, assim como seus aparentes modos de ligação e até os organismos em que são encontrados. Então, fica a pergunta: qual(is) seu(s) mecanismo(s) microscópico(s) de ação? Acredito que esta fascinante pergunta pode ser atacada por uma combinação de simulação computacional, com amostragem aumentada para variáveis coletivas de nucleação, e teoria de formação de vidros.

Dados experimentais razoavelmente precisos estão disponíveis agora para uma série destas proteínas. Alguém se habilita a estudá-las?

 

  • Recente estudo sugere o mecanismo que solutos orgânicos flexíveis promovem o processo inverso, ou seja, a nucleação de gelo.
  • Desenho de proteínas anti-congelamento usando dinâmica molecular e redes neurais: Debenedetti 2018.