Enviromics, nonlinear kernels and optimized training sets for a climate-smart genomic prediction of yield plasticity in maize (2021)
- Authors:
- Autor USP: COSTA NETO, GERMANO MARTINS FERREIRA - ESALQ
- Unidade: ESALQ
- Sigla do Departamento: LGN
- DOI: 10.11606/T.11.2021.tde-11102021-134352
- Subjects: APRENDIZADO COMPUTACIONAL; FENÓTIPOS; GENÔMICA; INTERAÇÃO GENÓTIPO-AMBIENTE; MILHO; PREDIÇÃO; SELEÇÃO GENÉTICA
- Keywords: Tipagem de ambientes
- Language: Inglês
- Abstract: A tipagem de ambientes em larga escala, ou simplesmente a envirômica, é um campo emergente de ciência de dados, tanto na pesquisa agrícola como nas rotinas de programas de melhoramento. Esta "omica" consiste em reunir e processar informações ambientais, respeitando a ecofisiologia do cultivo para, por fim, integrá-las na genômica quantitativa e na seleção baseada em modelos preditivos. No entanto, a maioria das atuais plataformas baseadas em predição aplicáveis ao melhoramento de plantas são baseadas nas relações genótipo-fenótipo, isto é; na modelagem a variação fenotípica em função da variação genômica caracterizada por marcadores moleculares, na qual o estado da arte é denominado por seleção ou predição genômica (GP). Apesar do sucesso de seu uso em estágios preliminares de melhoramento, sob condições restritas variações ambientais (p.ex: poucos ambientes ou um único ambiente), baixas acurácias ainda são observadas sob múltiplas condições ambientais, na presença de "interação genótipo por ambiente" (G×E). Por outro lado, o conhecimento da ecofisiologia dos cultivos pode ser a alternativa para impulsionar aumentar a acurácia da GP sob G×E. Esta variação ambiental molda respostas fenotípicas específicas de cada genótipo a um dado gradiente de fatores de solo, clima e manejo isto é, a norma de reação. Nesta tese, buscamos estudar esses aspectos, através da realização de três estudos voltados para o uso de envirômica com GP sob cenários de G×E, usando para isso orendimento de grãos de dois conjuntos de dados de híbridos de milho tropical. O primeiro estudo desta tese envolve o desenvolvimento do primeiro software de código aberto dedicado a ambitipagem (tradução proposta para o termo envirotyping) em predição genômica. Neste estudo, elucidamos o uso de sensoriamento remoto para popularizar o uso da ambitipagem, assim como aspectos de ecofisiologia úteis para compreender e definir os conceitos de 'ambiente', 'envirômica' e 'ambitipagem'. No segundo capítulo, verificamos os ganhos de acurácia adquiridos pela adoção de kernels não lineares (Gaussian Kernel, GK; Deep Kernel, DK) para modelagem de efeitos não-aditivos (p.ex: dominância e ambitipagem), usando o tradicional GBLUP (genomic best linear unbiased predictor) como método de referência. Nossos resultados sugerem que os kernels não lineares (GK e DK) são a melhor alternativa para modelar efeitos não-aditivos e de norma de reação. A adoção de GK ou DK reduziu o tempo computacional na execução dos modelos, como também aumentou a precisão para prever interações G×E complexas/cruzadas (variações no rank dos genótipos através dos ambientes). Por fim, observamos que o uso de GK ou DK para modelagem de efeitos não-aditivos é fundamental para expandir a resolução da GP em predizer a interação de um hibrido de milho particular através de múltiplos ambientes. Finalmente, no terceiro capítulo propomos o conceito de "marcador qualitativo de ambiente", desenvolvido conciliandoconceitos clássicos de ecofisiologia (Lei de Shelford) e caracterização da tipologia ambiental (isto é, frequência de ocorrência de classes qualitativas de fatores ambientais através do tempo e do espaço). A abordagem foi exemplificada com dois estudos de caso abrangendo o uso hipotético de GP sob ensaios de avaliação de em híbridos de milho em diversos ambientes. O uso combinado de envirômica e genômica possibilitou conceber uma plataforma de predição (denominada E-GP) que concilia fenotipagem seletiva (redução das populações de treinamento para GP) e predição de cenários futuros (isto é, G×E desconhecidas). Observamos que o aumento de informações fenotípicas em vários ambientes nem sempre corresponde ao aumento de acurácia da GP. Portanto, a representatividade da rede de avaliação de híbridos (genótipos mais representativos, avaliados nos ambientes "chave") é mais importante que o número de genótipos e ambientes considerados. Através de E-GP juntamente a algoritmos genéticos, fomos capazes de selecionar as combinações G×E mais representativas, o que refletiu diretamente em uma redução drástica do tamanho da rede experimental, conciliando aumento de acurácia. Por fim, constatamos que o GBLUP sem nenhuma informação de ambitipagem é ineficiente em predizer a plasticidade fenotípica dos híbridos de milho sob múltiplos ambientes e G×E desconhecida. Com E-GP foi possível realizar uma triagem dos melhores híbridos, em termos de plasticidade fenotípica, usando reduzidasinformações fenotípicas e suplementadas pelo amplo uso de genômica e envirômica. Tais resultados permitem vislumbrar abordagens inteligentes para o clima, envolvendo a redução drástica dos esforços de testes de campo à medida que aumenta o uso consciente de envirômica (e ambitipagem) combinada com genômica
- Imprenta:
- Publisher place: Piracicaba
- Date published: 2021
- Data da defesa: 22.07.2021
- Status:
- Artigo publicado em periódico de acesso aberto (Gold Open Access)
- Versão do Documento:
- Versão publicada (Published version)
- Acessar versão aberta:
-
ABNT
COSTA NETO, Germano Martins Ferreira. Enviromics, nonlinear kernels and optimized training sets for a climate-smart genomic prediction of yield plasticity in maize. 2021. Tese (Doutorado) – Universidade de São Paulo, Piracicaba, 2021. Disponível em: https://www.teses.usp.br/teses/disponiveis/11/11137/tde-11102021-134352/. Acesso em: 31 mar. 2026. -
APA
Costa Neto, G. M. F. (2021). Enviromics, nonlinear kernels and optimized training sets for a climate-smart genomic prediction of yield plasticity in maize (Tese (Doutorado). Universidade de São Paulo, Piracicaba. Recuperado de https://www.teses.usp.br/teses/disponiveis/11/11137/tde-11102021-134352/ -
NLM
Costa Neto GMF. Enviromics, nonlinear kernels and optimized training sets for a climate-smart genomic prediction of yield plasticity in maize [Internet]. 2021 ;[citado 2026 mar. 31 ] Available from: https://www.teses.usp.br/teses/disponiveis/11/11137/tde-11102021-134352/ -
Vancouver
Costa Neto GMF. Enviromics, nonlinear kernels and optimized training sets for a climate-smart genomic prediction of yield plasticity in maize [Internet]. 2021 ;[citado 2026 mar. 31 ] Available from: https://www.teses.usp.br/teses/disponiveis/11/11137/tde-11102021-134352/ - A novel GIS-based tool to reveal spatial trends in reaction norm: upland rice case study
- The modern plant breeding triangle: optimizing the use of genomics, phenomics, and enviromics data
- Nonlinear kernels, dominance, and envirotyping data increase the accuracy of genome-based prediction in multi-environment trials
- Enviromics: bridging different sources of data, building one framework
- EnvRtype: a software to interplay enviromics and quantitative genomics in agriculture
- Optimizing genomic-enabled prediction in small-scale maize hHybrid breeding programs: a roadmap review
- A novel way to validate UAS-based high-throughput phenotyping protocols using in silico experiments for plant breeding purposes
Informações sobre a disponibilidade de versões do artigo em acesso aberto coletadas automaticamente via oaDOI API (Unpaywall).
Por se tratar de integração com serviço externo, podem existir diferentes versões do trabalho (como preprints ou postprints), que podem diferir da versão publicada.
How to cite
A citação é gerada automaticamente e pode não estar totalmente de acordo com as normas
