000 03854nab a2200289 4500
003 BR-BrBNA
005 20250921155352.0
008 250921b2024 bl.ar|pooa||| 00| 0 eng |
040 _aBR-BrBNA
_bpor
072 _aU10 ; L72
_b5212 ; 4060
100 _aErgin, Malik
100 _a Koşkan, Özgür
245 _aPerformances of several machine learning algorithms and of logistic regression to predict Fasciola hepatica in cattle
500 _aSummaries (En, Pt); 48 ref.; 4 tables
520 _aAbstract – The objective of this work was to compare the performances of logistic regression and machine learning algorithms to predict infection caused by Fasciola hepatica in cattle. A dataset on 30,151 bovines from Uruguay was used. Logistic regression (LR) and the algorithms k-nearest neighbor (KNN), classification and regression trees (CART), and random forest (RF) were compared. The interquartile range (IQR) and z-score were used to improve the classification and compared to each another. Sex, age, carcass conformation score, fat score, productive purpose, and carcass weight were used as independent variables for all algorithms. Infection by F. hepatica was used as a binary dependent variable. The accuracies of LR, KNN, CART, and RF were 0.61, 0.57, 0.57, and 0.58, respectively. The variable importance of LR showed that adult cattle tended to be infected by F. hepatica. All models showed low accuracy, but LR successfully distinguished variables related to F. hepatica. Both the IQR and z-score show similar results in improving the classification metrics for the used dataset. In the dataset, data related to climate or factors such as body weight can improve the reliability of the model in future studies. Index terms: Fasciola hepatica, classification, data mining, fluke, machine learning.
520 _aResumo – O objetivo deste trabalho foi comparar os desempenhos da regressão logística e de algoritmos de aprendizado de máquina para prever nfecção por Fasciola hepatica em bovinos. Um conjunto de dados de 30.151 bovinos do Uruguai foi usado no estudo. Foram comparados a regressão logística (RL) e os algoritmos k-nearest neighbor (KNN), árvores de decisão (CART) e random forest (RF). O intervalo interquartil (IQR) e o escore-z foram usados para melhorar a classificação e comparados entre si. Sexo, idade, escore de conformação de carcaça, escore de gordura, propósito produtivo e peso da carcaça foram usados como variáveis independentes para todos os algoritmos. A infecção por F. hepatica foi usada como variável dependente binária. Os níveis de precisão de RL, KNN, CART e RF foram 0.61, 0.57, 0.57 e 0.58, respectivamente. A variável importância do modelo de RL mostrou que bovinos adultos tenderam à infecção por F. hepatica. Todos os modelos apresentaram baixa precisão, mas a RL distinguiu com sucesso as variáveis relacionadas a F. hepatica. Tanto o IQR quanto o escore-z mostram resultados semelhantes quanto à melhoria da métrica de classificação para o conjunto de dados utilizado. No conjunto de dados, dados relacionados ao clima ou a fatores como peso corporal, podem melhorar a confiabilidade do modelo em estudos futuros. Termos para indexação: Fasciola hepatica, classificação, verme trematódeo, aprendizado de máquina, mineração de dados.
650 _aBOVINO
650 _aFASCIOLA HEPATICA
650 _aVERME
650 _aPARASITA
650 _aINFECÇÃO
650 _aMÉTODO ESTATÍSTICO
773 0 _0920
_9357578
_dBrasília-DF Empresa Brasileira de Pesquisa Agropecuária - EMBRAPA 1966-
_o2025-5543
_tPesquisa Agropecuária Brasileira (Brazil)
_x0100-204X
_gv. 59 p. 1-8; (2024)
_wBR2025002489
856 _uhttps://www.scielo.br/j/pab/a/TxpxCVgvfsttrS3PTk9kbYD/?format=pdf&lang=en
942 _cANA
999 _c338294
_d338294