Aprendizagem de máquina para (bio)moléculas

A explosão de novos métodos em aprendizado de máquina (machine learning, ML) e redes neurais (neural networks, NN) também trouxe avanços para pequisa molecular. Veja abaixo algumas boas referências e tutoriais:

Introdução aos potenciais híbridos QM/MM – online

Segue uma breve introdução teórica e prática, utilizando a biblioteca pDynamo:

Vídeos de aulas e palestras

Com a pandemia de Covid-19 e o distanciamento social, gravamos e publicamos em meio digital diversas aulas e palestras científicas. Vejam abaixo alguns destes vídeos:

Arquitetura e performance de computadores e software

Entrada para agrupar textos recomendados sobre arquitetura de computadores e clusters, e desenho de software para computação científica:

  • Textos clássicos:
    • Talvez o texto inicial mais fundamental aqui é In Search of Clusters do Gregory Pfister (2a edição), que apresenta vários conceitos de arquitetura de computadores (cache, memoria virtual, etc) numa linguagem bastante acessível;
    • Um livro mais focado em hardware e desenho de microprocessadores é o Computer Organization and Design de Patterson & Hennessy. Este é de leitura mais difícil, com foco em engenheiros;
    • Sobre software, recomendo o livro Sistemas Operacionais Modernos do Tanenbaum, que introduz conceitos como gerenciamento de memória, etc.
    • Um livro bastante completo sobre métodos numéricos e implementações de seus algoritmos é o Matrix Computations de  Golub & Van Loan. Veja mais sobre métodos numéricos nesta postagem.

Temos cópias de todos esses livros no laboratório.


Informação e tecnologia quântica molecular

Embora mecânica quântica seja quase que trivialmente usada para descrever a estrutura eletrônica de moleculas e até processos biológicos de transferência de carga e energia, a construção de novos dispositivos tecnológicos baseados em informação quântica é uma nova e excitante fronteira de pesquisa que pretendemos explorar no laboratório usando síntese bioquímica e propriedades de spin de metais de transição. Vejam abaixo algumas referências informa/inspiradoras:

  • Papo de físico: Talvez o melhor livro para introdução aos fenômenos associados à informação quântica é The Quantum Challenge do George Greenstein e Arthur Zajonc. Tenho uma cópia em minha sala se alguém estiver interessado. Além de apresesentar (ou revisar) conceitos de mecânica quântica até computação quântica de forma bastante didática, há um apêndice sugerindo como montar experimentos quânticos simples, que deixam com vontade de debruçar numa bancada!
  • Curso introdutório recente (2018) sobre computação quântica no IFT-ICTP (aqui em SP). Veja os slides na aba “Files”. Revisão de 1998 com princípios básicos. Aulas online do John Preskill, um dos pioneiros da área, para curso de Quantum Computation em Caltech, EUA;
  • Daqui pra baixo já é papo de físico-químico: Podemos aplicar computadores quânticos (pelo menos a sua lógica, já que os primeiros hardwares ainda são desenvolvidos) para cálculos de química quântica. Esta revisão mostra como cálculos moleculares como HF, CC, etc podem ser realizados. A biblioteca OpenFermion é usada para interfaciar problemas (e programas como o PySCF) da química quântica com algoritmos e computadores quânticos.
  • O fenômeno da teleportação quântica foi recentemente observado em moléculas fotoativadas. Seria possível construir um dispositivo semelhante com metaloproteínas? Como podemos simular estes processos?
  • Esta revisão mostra como dispositivos moleculares podem ser sintetizados e testados em busca de propriedades como emaranhamento e lenta decorrelação, e para construções ou realizações de bits quânticos (qubits).
  • Elegante artigo do sambista e nobelista Roald Hoffmann mostra como conceitos simples em química orgânica e estrutura eletrônica podem explicar um comportamento complexo de intereferência na condutância molecular. A linguagem e a organização do artigo também são bastante peculiares e uma assinatura do autor.

Ética em neurotecnologia

braincirc

É bastante pertinente a discussão de questões éticas relacionadas às combinações de avanços em neurociências com tecnologias de inteligência artificial. Pelo menos quatro destas questões são abordadas no estimulante comentário publicado há alguns meses na revista Nature: privacidade, auto-determinação, igualdade social e aprimoramento mental.

Transferência de elétrons: Não-adiabática, PCET e outros bichos…

Outro termo da moda e abusado na literatura, PCET possui várias definições e mecanismos. Veja algumas referências para navegar neste assunto:

Programas científicos são diferentes de equipamentos de laboratório

pillarsInteressante postagem e artigo do Konrad Hinsen sobre reproducibilidade de pesquisa computacional. Sua discussão, um tanto epistemológica, atualiza a idéia bem disseminada que ciência é baseada em dois pilares, experimento e teoria. Hinsen prefere dizer que observações e modelos, são os verdadeiros pilares e, portanto, simulação computacional é apenas um experimento com modelos. Leia a postagem completa aqui.

Créditos por um trabalho científico

author
Pesquisa científica é cada vez mais realizada em equipe. Quando a comunicação dos resultados obtidos na pesquisa envolve a publicação de um artigo, muitas vezes é difícil identificar qual a contribuição de cada autor para o trabalho. Isto é importante, por exemplo, porque avaliações do desempenho dos pesquisadores são baseadas em suas publicações.

Leia mais

Tratamento moderno da correlação forte: DMGR, MPS e afins

Postagem sobre métodos modernos para cálculo de sistemas quânticos envolvendo emaranhamento ou correlação forte. Agregados de ferro-enxofre ou complexos polinucleares de metais de transição são exemplos moleculares cuja estrutura eletrônica tem considerável correlação forte.

Sugestões são sempre bem vindas (veja seção de comentários abaixo)!

 

Referências:

  • Orus 2014: Revisão mais didática (errr, na medida do possível para um assunto tão novo e complexo :-);
  • Schollwock 2005: Referência clássica (um tanto indigesta) no principal periódico de revisões em física;
  • Chan 12: Mini-revisão sobre vários tipos de MPS;
  • Chan 15: Talvez a melhor introdução ou revisão prática de DMRG aplicada a cálculos moleculares;
  • Chan 16: Escrita pelo Garnet Chan com o S. White (o pai do DMRG), com objetivo de conectar as linguagens de DMRG e MPS. Talvez a Introdução seja uma boa leitura inicial;
  • Sem relação conceitual com DMRG, métodos estocásticos, como o método SHCI, também são alternativas promissoras para cálculo de sistemas moleculares fortemente correlacionados;
  • Singular-Value Decomposition (SVD): Wikipedia;
  • Decomposição de Schmidt: Wikipedia; Notem que este matemático foi aluno do David Hilbert e desenvolveu vários métodos úteis em mecânica quântica, como a ortogonalização Gram-Schmidt;
  • Tensores: Uma busca simples no Google, por exemplo pela expressão “introduction tensor algebra”, já dá boas indicações. Em particular, achei interessantes estas introduções por Dullemond & Peeters e o primeiro capítulo do B. Porat.
  • Representações tensoriais também tem diversas aplicações em química quântica, como didaticamente apresentado aqui pelo D. Crawford;

Cursos e Tutoriais:

Programas:

  • Block: Além de programa strandalone, também esta (em parte) implementado junto do ORCA (versões 3 e 4). Ambos estão instalados no nosso cluster fragile. Se tiver interesse em rodar alguma computação, pode tentar brincar ou começar com o ORCA usando sistemas simples, tipo H2 com distância longa, ou C2 e os sistemas teste usados no artigo do Chan 15. Só depois tente algum sistema complexo ou partir para o PySCF;
  • PySCF: Faz vários tipos de contas de química quântica e funciona como uma interface em Python. Embora não faça cálculos de DMRG ou MPS, é uma interface para rodar ORCA e afins;
  • ITensor: Programa para expressar diagramas de redes tensoriais e variações de MPS. Sua grande vantagem é acompanhar os índices automaticamente, liberando esta responsabilidade do usuário. Talvez seja ineficiente para cálculos moleculares de alta precisão (como DMRG comparando com o BLOCK), mas pode servir como uma ferramenta para aprendizado e para gerar modelos aproximados. Esta revisão descreve o ITensor detalhadamente.

Curiosidades:

  • Artigo do M. Reiher et al. propondo justamente a estrutura eletrônica de agregados de ferro-enxofre como possível aplicação para demonstrar a supremacia de computadores quânticos;
  • Veja mais sobre computação quântica em problemas de estrutura eletrônica fortemente correlacionada nesta revisão e talvez nesta outra, ambas do Aspuru-Guzik;
  • Palestra do Ali Alavi no CECAM, sobre métodos estocásticos (QMC) para tratamento do mesmo problema de estrutura eletrônica fortemente correlacionada, mas sem computadores quânticos e sem DMRG. Notem que por volta de 35 minutos, ele vai confiantemente dar uma demonstração que termina em NaNs… :-)
  • Workshop online em 2021 sobre uso de computadores quânticos em química quântica;

Mecanismos moleculares e energéticos da Fotossíntese

A referência fundamental para se começar a compreender os processos moleculares e as proteínas envolvidos na absorção de energia luminosa e sua transdução para energia química em sistemas biológicos, também chamada de Fotossíntese, é o livro do R. Blankenship, Molecular Mechanisms of Photosynthesis. Tenho uma cópia para emprestar aos interessados. Seguem outros artigos interessantes:

  • Estrutura da desidrogenase NDH fotossintética e oxigênica. Como é relacionada/homóloga ao complexo respiratório I, ambas devem ter mecanismos semelhantes para entrada de Q/PQ e para acoplamento redox com bombeamento de prótons;
  • Revisão sobre efeitos quânticos, principalmente coerência, para separação de carga: Romero 2017;
  • Outra revisão sobre coerência quântica, além de sistemas biológicos: Scholes 2017;
  • Experimentos com XFEL mostram a evolução temporal da densidade eletrônica e, portanto, o mecanismo reativo, nos centros reativos (Mn4O4Ca) e quinonas do Fotossistema II.

The Death of Expertise – Tom Nichols

expertMuitas pessoas pensam que democracia significa igualdade de opinião. Como se todas opiniões, em todos os campos ou assuntos, fossem igualmente boas ou válidas. Mas, democracia é apenas igualdade política, em que cada voto tem o mesmo valor.

Leia mais

Simulação de membranas e proteínas embebidas

Agrupamento de informações e links sobre simulação por mecânica molecular de membranas e proteínas associadas.

Montagem e inserção:

  • MemGen servidor para gerar geometrias e topologias;
  • O servidor Charmm-GUI também funciona, com diversas composições membranares;
  • Atualmente o melhor método para inserção de proteínas e solutos em membranas é o da pressão lateral, proposto por Javanainen em 2014;

Cuidados e dicas:

  • PMFs de inserção devem usar uma coordenada de reação (CR) com geometria cilíndrica, para corrigir efeitos de ondulações da membrana. Mas, cuidado! Na minha recente experiência, o uso da geometria cilíndrica apresenta outros problemas como violações da posição da molécula inserida, mesmo respeitando a CR. Este comportamento deve ser investigado no futuro;
  • Sempre conferir as janelas de US se houve algum flip-flop de lipídeo;
  • Cuidado com o tamanho da caixa e a definição da CR. Podem acontecer mudanças de posição relativa, mesmo respeitanto a CR, por causa das condições periódicas (PBC);

Referências:

 

Métodos numéricos, estatísticos e de aprendizagem de máquina

Nesta postagem vou tentar agrupar algumas boas referências sobre áreas de métodos numéricos (álgebra linear, primeiro bloco abaixo), estatística (segundo bloco) e aprendizado de máquina (machine learning, ML – terceiro bloco – apenas métodos matemáticos estão aqui incluídos. Veja aqui para ML aplicado métodos físicos ou a moléculas.):

  • Uma das referências fundamentias sobre métodos numéricos é o livro Matrix Computations de Golub e van Loan. Temos uma cópia no lab, e tenho a última (4a) versão se alguém tiver interesse;
  • Uma boa referência sobre métodos numéricos de otimização e a álgebra linear associada é o livro Practical Optimization;
  • Boa revisão e tutorial sobre Algebra linear em Python;
  • Excelentes explicações gráficas de Algebra linear e transformações matriciais;
  • Curso de Algebra Linear do MIT;
  • Singular-value decomposition (SVD). Método similar a análise espectral (autovetores), de crescente importância para redução de dimensionalidade e interpretação de dados multi-dimensionais. Por exemplo, é aplicado para justificar métodos de renormalização de grupo (como DMRG);
  • Texto pedagógico sobre transformada de Legendre, muito usada para expressão de quantidades termodinâmicas e relações em mecânica estatística.


Informações introdutórias – QBQ5782

Observações iniciais sobre o curso:

  • O objetivo do curso é introduzir aos alunos as teorias e os conceitos fundamentais dos métodos de simulação molecular. Não é um curso apenas de caráter prático ou para aprender a “rodar” programas. Espera-se que ao final do curso, os alunos terão bases conceituais para utilizar outros programas de simulação molecular do seu interesse, assim como preparar diferentes tipos de simulações e analisar seus resultados criticamente.
  • Seguiremos aproximadamente o conteúdo apresentado na 2a edição (de 2007) do livro “A Practical Introduction to the Simulation of Molecular Systems” escrito pelo Martin J. Field, Cambridge University Press, 2007. Diversas bibliotecas da USP (IQ, IF, EP, IQSC, etc) possuem cópias impressas.
  • Sugerimos que os alunos interessados em cursar a disciplina consultem este livro para conhecerem mais sobre o conteúdo e o nível esperado da disciplina.
  • Exemplos e exercícios práticos da disciplina serão executados principalmente com o programa pDynamo, que utiliza a linguagem Python e é apresentado no livro citado acima. Logo, o curso será melhor aproveitado se o aluno possuir alguma experiência em Python ou em outra linguagem de programação em nível introdutório. Experiência com o sistema operacional Linux também é recomendada.
  • A parte prática e os exercícios do curso deverão ser realizados pelos alunos idealmente em seus próprios laptops ou computadores. Pretendemos disponibilizar um computador em nosso laboratório para os alunos que não tiverem seus próprios recursos.
  • Avaliação será feita por um trabalho (50% da nota final) e a média dos exercícios propostos ao longo do curso (outros 50% da nota);
  • Acreditamos que alunos graduados (bacharelado) em Química tem os pré-requisitos necessários para acompanhar o curso. Graduados em Física deverão ter conhecimentos pelo menos de uma disciplina de graduação de bioquímica (estrutura e química de biomoléculas) ou química orgânica. Graduados em cursos da área de Biológicas deverão ter conhecimentos pelo menos de disciplinas de física (V, estrutura da matéria) e físico-química (termodinâmica e cinética química), caso contrário terão bastante dificuldade em acompanhar o curso.
  • Alunos de outras universidades também podem se matricular e obter os créditos como alunos especiais, vejam mais informações aqui.

Alunos interessados e ainda com dúvidas sobre a disciplina, sintam-se a vontade para conversar a respeito com o docente pelo e-mail garantes (at) iq.usp.br, telefone (11) 3091-3848 ou pessoalmente (sala 915, IQ).

Outras proteínas de Ferro-enxofre e metaloenzimas

Postagem para reunir artigos e referências sobre metaloenzimas com sítios polinucleares e proteínas de ferro-enxofre, além dos casos especiais da cadeia de transporte de elétrons mitocondrial, fotossíntese, etc.

  • A evolução e conservação de diversos módulos proteicos em metaloproteínas é estudada neste artigo. Pode servir como ponto de partida para escolha de uma região quântica em um cálculo QC/MM ou para o desenho de novas metaloenzimas.
  • Diversas fosfatases tem atividade dependente de pares de íons de ferro. Um exemplo interessante é esta PhoX. Seu mecanismo pode ser investigado por simulações híbridas e comparado com as fosfatases ácidas-roxas;
  • Hidrogenase [NiFe] com diversos cluster FeS, alguns com geometria alternativa (não cuboidal), flavina e até proposta de bifurcação da transferência eletrônica. Outro lindo desafio para simulação! A estrutura foi determinada pelo mesmo grupo de pesquisa do trabalho abaixo (enzima com 46 centros de FeS). Mas, cuidado: as geometrias alternativas podem ser artefato da incidência destrutiva de raios-X sobre o centros metálicos…
  • Para quem ficou impressionado (eu fiquei!) com o “cabo” de 7 a 9 clusters de [FeS] presente no Complexo I, vejam esta enzima com 46 clusters [FeS]! A estrutura contém outras curiosidades como metais de tungstênio, canais para transporte de gases e hidratados, e grupos prostéticos incomuns! Alguém maluco o suficiente para modelar esta belezinha???
  • Estruturas cristalográficas de resolução ultra-aumentada permitem a “observação” de átomos de hidrogênio, pares eletrônicos e até, pasmen, densidade de carga de orbitais de fronteira de metais de transição. Vejam este artigo descrevendo uma proteína de [4Fe-4S] com resolução de 0.48 angstroms! Alguém interessado em construir um modelo híbrido QC/MM para esta proteína e verificar a precisão dos cálculos na reprodução da densidade de carga?
  • Alguns organismos não possuem proteínas funcionais especializadas para armazenagem intracelular de ferro, comoa ferritina. Livre em solução, este metal é tóxico, como pode-se imaginar do seu comportamento redox. A solução encontrada nestes casos é estocar grandes agregados de ferro, com até 20 mil átomos!

Desenho de proteínas

Temos aqui uma entrada para agrupar artigos interessantes sobre desenho de proteínas:

  • Artigo que inspirou esta postagem: Revisão do David Baker na Nature, 2016;
  • Vídeo de palestra do David Baker sobre desenho de proteínas para diagnóstico e tratamento do SARS-CoV2;
  • A expressão heteróloga e, portanto, a evolução dirigida de metaloproteínas é complexa. Este artigo apresenta uma interessante solução experimental. Este outro artigo apresenta outra solução;
  • Este artigo mostra um interessante aumento de promiscuidade catalítica por excitação eletrônica dos cofatores envolvidos. Veja também o comentário no final do artigo;
  • Boa mini-revisão introdutória sobre os avanços iniciais no desenho computacional de enzimas;
  • Outra mini-revisão, com enfoque histórico sobre importantes contribuições neste campo;

Citocromo bc1 e ciclo-Q

O mecanismo redox no citocromo bc1 (Complexo III mitocondrial), chamado de ciclo-Q, já foi bastante estudado, embora continue ainda discutido e fruto de especulação. Veja abaixo alguns artigos interessantes nesta discussão:

  • Interessante sistema modelo com várias propriedades medidas, útil para testar métodos de simulação para o sítio Qo. Mas a presença de Ru e ligante bipiridina pode ser um desafio: Kramer 2005;
  • Complexo III como um barramento eletrônico-molecular: Dutton & Osyczka 2010
  • Revisão sobre estrutura proteica e reatividade do ciclo Q: Cramer 2011;
  • Revisão atual sobre estruturas cristalográficas: Xia 2013;
  • Restrições termodinâmicas e evolução dos potenciais redox no ciclo-Q em diferentes organismos: Baymann 2016;
  • Identificação de resíduos envolvidos no transporte de H+ no sítio Qo: Daldal 2016;
  • Simulações mais recentes do mecanismo de reação no sítio Qo: Solovyov 2016;
  • Comparação de diversos métodos de cálculo de estrutura eletrônica para determinar a afinidade eletrônica de quinonas: Pantazis 2018;
  • Condições termodinâmicas para prevenir curto-circuito na transferência eletrônica bifurcada (2 elétrons) no ciclo-Q;
  • Revisão autobiográfica do Anthony Crofts sobre sua vida e resultados de pesquisas no citocromo bc1.