Vorhersage und Klassifizierung der Verhaltensselektion durch maschinelles Lernen in einem Geruchserkennungsprogramm für Hunde

Scientific Reports Band 13, Artikelnummer: 12489 (2023) Diesen Artikel zitieren

218 Zugriffe

2 Altmetrisch

Details zu den Metriken

Es besteht ein wachsendes Interesse an der Verhaltensforschung bei Hunden, insbesondere für Arbeitshunde. Hier nutzen wir einen Datensatz einer Geruchserkennungskohorte der Transportation Safety Administration von 628 Labrador Retrievern, um Vorhersage- und Klassifizierungsstudien für Verhaltensmerkmale und Umweltauswirkungen durch maschinelles Lernen (ML) durchzuführen. Über einen 12-monatigen Pflegezeitraum lagen Daten zu vier Zeitpunkten vor, nach denen Hunde in ein Trainingsprogramm aufgenommen oder aus dem Tierheim ausgeschlossen wurden. Drei überwachte ML-Algorithmen zeigten eine solide Leistung bei der korrekten Vorhersage, welche Hunde in das Trainingsprogramm aufgenommen würden, zeigten jedoch eine schlechte Leistung bei der Unterscheidung derjenigen, die eliminiert wurden (~ 25 % der Kohorte). Der 12-monatige Testzeitpunkt erbrachte die beste Fähigkeit, akzeptierte und ausgeschiedene Hunde zu unterscheiden (AUC = 0,68). Klassifizierungsstudien mittels Hauptkomponentenanalyse und rekursiver Merkmalseliminierung mittels Kreuzvalidierung zeigten die Bedeutung von Geruchs- und Besitzmerkmalen für einen Such- und Abruftest für Flughafenterminals sowie von Besitz-, Selbstvertrauens- und Initiativemerkmalen für einen Umwelttest. Unsere Ergebnisse legen nahe, welche Tests, Umgebungen, Verhaltensmerkmale und Zeitverläufe für die Auswahl von Geruchsspürhunden am wichtigsten sind. Wir diskutieren, wie dieser Ansatz als Leitfaden für weitere Forschungen dienen kann, die kognitive und emotionale sowie soziale und ökologische Auswirkungen umfassen.

Maschinelles Lernen (ML) ist ein Teilgebiet der künstlichen Intelligenz (KI), das eine Kombination aus Algorithmen und Statistiken verwendet, um eine Vielzahl analytischer Funktionen für eine Vielzahl von Datentypen auszuführen. ML ist in zwei Algorithmusklassen unterteilt: überwachtes Lernen für gekennzeichnete Trainingsdaten und unüberwachtes Lernen für unbeschriftete Daten. Überwachte Methoden ermöglichen das Lernen aus bekannten Eingaben und Ausgaben, um unbekannte Ausgaben aus bekannten Eingaben vorherzusagen (Regressionsanalyse) oder um zu bestimmen, welche Datenkategorien für die Vorhersage von Ergebnissen am wichtigsten sind (Klassifizierungsanalyse). Bei überwachten ML-Anwendungen im Verhalten von Hunden wurden am Hund montierte Trägheitssensoren verwendet, um automatisierte Hundeethogramme zu erstellen, die auf individuelle Unterschiede reagieren1,2, und Videos zur Klassifizierung von ADHS-ähnlichem Verhalten3. In unbeaufsichtigten ML-Studien bei Hunden wurden Video- und C-BARQ-Verhaltensfragebogendaten für explorative Analysen4 und Sensordaten zur Vorhersage des Erfolgs von Blindenführhunden5 verwendet. Beim Menschen wurde überwachtes maschinelles Lernen unter Verwendung nicht sensorischer, aufgabenrelevanter Testdaten zur Vorhersage des Erfolgs bei der Arbeitsleistung eingesetzt6, uns sind jedoch keine derartigen Studien an Hunden bekannt. Hier verwenden wir überwachte Methoden, um vorherzusagen, welche Hunde bei einem Vortrainingsprogramm zur Geruchserkennung erfolgreich sein oder aus Verhaltensgründen scheitern werden. Während diese Forschung den Einsatz bei Arbeitshunden angewendet hat, dürfte sie auch zu neuen Erkenntnissen über Lern- und Arbeitsleistung bei Säugetieren im Allgemeinen, einschließlich des Menschen, beitragen. Die menschliche Verhaltensgenetik ist jedoch tendenziell durch ein hohes Maß an Heterogenität, Polygenität und – aufgrund der negativen evolutionären Selektion selbst schwach schädlicher Variationen – winziger Effektgrößen einzelner Variationen gekennzeichnet. Daher würden Humanstudien eine weitaus größere Leistung erfordern und die identifizierten Variationen hätten keinen direkten Nutzen. Im Gegensatz dazu weisen Hunde eine stark reduzierte Heterogenität, Polygenität und negative Selektion sowie eine starke positive Selektion für verschiedene Merkmale7 auf. Der ultimative Effekt besteht darin, dass Hunde eine deutlich höhere Fähigkeit besitzen, alle Arten von Merkmalen genetisch abzubilden. Der Nachteil besteht darin, dass das Bindungsungleichgewicht bei Hunden um ein Vielfaches größer ist, was zu großen Kartierungsintervallen führt. Dies kann jedoch durch die genetische Kartierung von Variationen, die bei allen Rassen häufig vorkommen, zwischen den Rassen abgemildert werden8,9,10.

Riechspürhunde werden seit langem eingesetzt, um Sprengstoffe, kontrollierte Substanzen, andere regulierte Materialien (z. B. Insekten, Lebensmittel und Pflanzen) sowie menschliche Gerüche für die öffentliche Sicherheit aufzuspüren11,12. In jüngerer Zeit umfassen die Geruchserkennungsfunktionen von Hunden auch medizinische Erkrankungen (z. B. einen niedrigen Blutzuckermarker bei Diabetes und eine SARS-CoV-2-Infektion13). In den Vereinigten Staaten werden die meisten Militär- und Polizeihunde als Hunde mit doppeltem Verwendungszweck ausgebildet, die sowohl Geruchserkennung als auch Schutz bieten. Die anderen Hauptgruppen von Arbeitshunden sind Blindenführhunde für Menschen mit Blindheit oder Sehbehinderung und Diensthunde zur Unterstützung von Menschen mit anderen Behinderungen. Die Kostenspanne für die meisten vorab ausgebildeten Arbeitshunde liegt zwischen 40.000 und 80.000 US-Dollar14, und die Preise steigen weiter, weil die Nachfrage das Angebot übersteigt. Diese Kosten können sich etwa verdoppeln, wenn man die Ausbildung mit einbezieht. Aufgrund dieser Tatsachen und der Tatsache, dass die Gesamterfolgsquote bei der Ausbildung unter 50 % liegt, gibt es einen enormen Anreiz, Arbeitshunde effizienter zu züchten und auszubilden11,15. Es wurden zwar explorative und prospektive Studien zu neuen Testsystemen für Spür- und Assistenzhunde durchgeführt, diese wurden jedoch noch nicht weit verbreitet16. Allerdings gibt es große Datensätze zu Trainings-, Leistungs- und Gesundheitsdaten von Arbeitshunden von Bundes- und Privatinstitutionen, die noch nicht gründlich analysiert wurden15,17. Es bleibt daher möglich, dass bestehende standardisierte Datensätze, die weiterhin gesammelt werden und bereits umfangreich und daher ideal für ML sind, der effizienteste und produktivste Weg sein könnten, das Verständnis der für Arbeitshunde erforderlichen Verhaltensmerkmale zu verbessern.

Bei der vorliegenden Arbeit handelt es sich um eine Studie über den Erfolg und die Eliminierung vor dem Training aus Verhaltensgründen im Rahmen des Zucht- und Trainingsprogramms zur Geruchserkennung von Hunden der Transportation Security Administration (TSA). Die Daten wurden von Hunden gesammelt, die im Zeitraum von 2002 bis 2013 gepflegt und getestet wurden. Während ihrer 15-monatigen Pflegezeit wurden die Hunde, beginnend im Alter von 3 Monaten, alle drei Monate in die Einrichtung des TSA-Programms gebracht, um dort beurteilt zu werden eine Reihe von Tests. Die Tests bewerteten olfaktorische Merkmale wie die Fähigkeit, Objekte anhand des Geruchs zu finden, und andere relevante Merkmale wie die Motivation, Spielzeug zu besitzen oder Tauziehen zu spielen. Gleichzeitig bewerteten die Hundeführer die Hunde auch nach verschiedenen anderen Merkmalen, einschließlich der Zusammenarbeit mit den Hundeführern und der Leistung bei Aufgaben. Am Ende des 12-monatigen Testzeitraums wurden die Hunde entweder aus medizinischen (17,2 %) oder verhaltensbezogenen (23,9 %) Gründen in das Trainingsprogramm aufgenommen (58,9 %) oder davon ausgeschlossen.

Ähnliche Vortrainings- und Trainingstests zur Geruchserkennung werden seit mehreren Jahrzehnten eingesetzt18. Die dabei verwendeten Verhaltensbewertungsmethoden wurden auf unterschiedliche Weise untersucht und validiert, unter anderem durch den Nachweis vergleichbarer Auswirkungen von Bewertungs- und Kodierungsansätzen bei TSA-Riechspürhunden19,20,21,22,23. Eine ähnliche Studie wie unsere20, bei der sich 106 Hunde im gleichen Zeitraum mit unserer Hundepopulation überschnitten, kann aufgrund der vielen Unterschiede nicht direkt mit unserer verglichen werden. Unter anderem verfügte diese Studie über a priori Ausschlusskriterien, die Hunde ausschlossen, die aus Verhaltensgründen eliminiert werden könnten, insgesamt sechsmal weniger Hunde aufwies, drei Rassen gegenüber einer bei uns einschloss und die Kohorte nicht willkürlich in zwei Gruppen zu je 50 Personen aufgeteilt wurde % (eines wird für die Entwicklung von Ethogrammen für Verhaltenskodierungen und das andere für den Vergleich von Bewertungs- und Kodierungsansätzen verwendet). Ein wichtiges Ergebnis dieser Arbeit – und die Hauptfrage der Studie – bestand darin, zu zeigen, dass die in dieser und unserer Studie verwendeten Bewertungsmethoden/-daten mit Kodierungsmethoden in der Vorhersagevalidität vergleichbar sind. Das ist auch deshalb wichtig, weil die Durchführung ihrer Codierungstests zwei- bis mehrfach länger dauerte.

Wir haben kürzlich in derselben TSA-Kohorte das Merkmal der Eliminierung vor dem Training aus Verhaltensgründen genetisch kartiert17. Der tatsächliche Grund für die Eliminierung ist in dieser und der vorliegenden Arbeit nicht klar definiert, außer dass verhaltensbedingte und medizinische Eliminierung unterschieden wurden. In der oben erwähnten Studie – an 106 Hunden derselben Arbeitshundepopulation, die sich mit unserer überschnitten hat – war der Grund für die Eliminierung von zwei Hunden, dass sie „während der Tests mehrfach Anzeichen von extremem Stress zeigten“20. Andere Verhaltensmerkmale, die mit der Auswahl eines Geruchsspürhundes nicht vereinbar sind, umfassen eine schlechte Sozialisierung von Menschen oder Hunden, niedrige Energie und ein erhöhtes Maß an Erregbarkeit, Ablenkbarkeit, Aggression und verschiedene Arten von Angst oder Furcht. Die Herausforderung besteht also darin, dass die Auswirkungen, die wir zu identifizieren versuchen, subtil und komplex sein können.

In dieser Studie haben wir überwachte ML-Algorithmen angewendet, um zu testen, wie gut Erfolg oder Eliminierung aus Verhaltensgründen vorhergesagt werden kann, und um die wichtigsten Merkmale zu jedem Zeitpunkt und an jedem Ort des Tests zu identifizieren. Unsere Studie zur Merkmalsklassifizierung zielt darauf ab, Verhaltenstestunterschiede aufzudecken, die zu erheblichen zeitlichen oder umweltbedingten Auswirkungen auf die Verhaltenseliminierung führten. Diese Arbeit ist Teil der laufenden Bemühungen, mithilfe analytischer Methoden und Genomik die Auswahl von Hunden in der Vorbereitungsphase zu verbessern. Unsere Ergebnisse deuten auf entwicklungsbedingte und biologische Auswirkungen sowie neue Ansätze hin.

Die in der Kohorte bewerteten Merkmale stellen Maßstäbe für Selbstvertrauen/Angst, die Qualität des jagdbezogenen Verhaltens und die Interaktionsmerkmale zwischen Hund und Trainer dar19,20. Die Merkmale „Jagd/Apportieren“, „Physischer Besitz“ und „Unabhängiger Besitz“ wurden sowohl im Flughafenterminal- als auch im Umwelttest gemessen, während fünf bzw. sieben weitere Merkmale für jeden Test spezifisch waren (Tabelle 1). Die Tests am Flughafenterminal umfassen die Suche nach einem duftenden Handtuch, das in einem simulierten Terminal platziert ist, und die Beobachtung der Reaktion eines Hundes auf den Hundeführer. Dies stellt die tatsächliche Geruchserkennungsarbeit dar, die von vollständig ausgebildeten und eingesetzten Hunden erwartet wird. Da die Aufgaben zwischen den Zeiträumen konsistent waren, zeigen die Tests am Flughafenterminal, dass sich die Hunde mit zunehmendem Alter verbessern. Alle Merkmalswerte mit Ausnahme von „Physikalischer Besitz“ und „Unabhängiger Besitz“ stiegen im Laufe der Zeit an, wobei der größte Anstieg zwischen den 6- und 9-Monats-Tests zu verzeichnen war (Abb. 1a). Dies kann darauf zurückzuführen sein, dass Welpen in jungen Jahren zunehmend besitzergreifend sind und nicht ausreichend trainiert werden. Die allgemeine Verbesserung im Laufe der Zeit könnte auf das höhere Alter der Hunde oder auf die gesammelten Testerfahrungen zurückzuführen sein. Im Vergleich zu akzeptierten Hunden wiesen diejenigen, die aus Verhaltensgründen aus dem Programm ausgeschlossen wurden, in allen Merkmalen niedrigere Durchschnittswerte auf.

(a) Radardiagramme der Durchschnittswerte für jedes Merkmal für die Flughafenterminaltests. (b) Radardiagramme der Durchschnittswerte für jedes Merkmal in den Umwelttests; M03 = BX (Geschenkladen), M06 = Holzladen, M09 = Flughafenfracht, M12 = Flughafenterminal.

Zu den Umwelttests gehörten ein Spaziergang mit Hunden, eine Suche und das Spielen mit Spielzeug an einem lauten Ort, der sich zu jedem Zeitpunkt änderte. Die Merkmale maßen verschiedene Verhaltensweisen von Hunden, während sie sich durch die Orte bewegten, und ihre Leistung beim Umgang mit Spielzeug. Akzeptierte Hunde erzielten in allen Tests sowohl höhere als auch konsistentere Ergebnisse (Abb. 1b). Der größte Unterschied in der Bewertung zwischen akzeptierten Hunden und solchen, die aufgrund ihres Verhaltens ausgeschlossen wurden, trat im Woodshop nach 6 Monaten auf. Das lässt darauf schließen, dass diese Kombination aus Test und Umgebung am besten vorhersagen kann, welche Hunde in das Trainingsprogramm aufgenommen werden. Zu den Merkmalen, die den größten Unterschied zwischen den beiden Ergebnissen aufwiesen, gehörten körperlicher und unabhängiger Besitz sowie Selbstvertrauen.

Drei verschiedene Klassifizierungsalgorithmen für maschinelles Lernen wurden eingesetzt, um die Akzeptanz basierend auf ihrer Fähigkeit, mit binären Klassifikatoren umzugehen, vorherzusagen: Logistische Regression, Support Vector Machines und Random Forest. Die Daten wurden in Trainings- (70 %) und Testdatensätze (30 %) mit den gleichen Erfolgsquoten und Verhaltensbeseitigungsstatus wie im übergeordneten Datensatz aufgeteilt. Nach dem Training des Modells wurden Metriken für die Qualität des Modells angegeben, wie in den Methoden beschrieben. Die Erfolgsprognosen für die Tests des Flughafenterminals ergaben konstant hohe Genauigkeiten zwischen 70 und 87 % (Tabelle 2). Die Fähigkeit, erfolgreiche Hunde vorherzusagen, verbesserte sich im Laufe der Zeit, wobei die beste Prognose auf der Grundlage der F1- und AUC-Werte einem Zeitraum von 12 Monaten entsprach. Bemerkenswerterweise trat dieses Muster mit einer allgemeinen Verringerung sowohl der Anzahl der Hunde als auch des Verhältnisses erfolgreicher zu ausgeschiedenen Hunden auf (Ergänzungstabelle 1). Die beobachtete Spitzenleistung wurde für das Random-Forest-Modell nach 12 Monaten beobachtet: Genauigkeit von 87 %, AUC von 0,68 und harmonischer Mittelwert der Erinnerung und Präzision „F1“ von 0,92 bzw. 0,53 für akzeptierte bzw. ausgeschiedene Hunde. Das logistische Regressionsmodell schnitt nach 12 Monaten geringfügig schlechter ab. Nimmt man den Mittelwert der vier Zeitpunkte für Genauigkeit, AUC und akzeptiertes und eliminiertes F1, war die logistische Regression für die ersten drei Elemente etwas besser als Random Forest und umgekehrt für das vierte. Das Support Vector Machines-Modell erzielte uneinheitliche Ergebnisse, was größtenteils auf die schlechte Erinnerung für eliminierte Hunde zurückzuführen war (0,09 gegenüber 0,32 und 0,36 für die anderen Modelle).

Die Erfolgsprognose der Umwelttests ergab schlechtere und variablere Ergebnisse (Tabelle 2). Ein Faktor, der zu der schlechteren Leistung beigetragen hat, könnte die geringere mittlere Anzahl von Hunden mit Testdaten im Vergleich zum Airport-Terminal-Test gewesen sein (56 % gegenüber 73 % der Kohorte). Insgesamt war das logistische Regressionsmodell bei der Vorhersage des Erfolgs auf der Grundlage der F1- und AUC-Werte am effektivsten. Dieses Modell zeigte ein Muster der Leistungsverbesserung mit fortschreitenden Monaten. Nach 12 Monaten betrug die Genauigkeit 80 %, die AUC betrug 0,60 und F1 betrug 0,88 bzw. 0,36 für akzeptierte bzw. ausgeschiedene Hunde. Die besten Ergebnisse nach 12 Monaten fielen mit der geringsten Anzahl von Hunden zusammen, die aus Verhaltensgründen eliminiert wurden. Support Vector Machines hatte zu jedem Zeitpunkt einen extrem niedrigen oder gar keinen F1 für ausgeschiedene Hunde. Alle drei Modelle hatten nach drei Monaten die höchste Genauigkeit (0,82–0,84) und die höchste oder zweithöchste F1 für akzeptierte Hunde (0,90–0,91). Allerdings zeigten alle drei Modelle eine mangelhafte Leistung bei der Vorhersage der Elimination nach 3 Monaten (F1 ≤ 0,10).

Um die Vorhersageleistung zu maximieren, wurde eine vorwärtsgerichtete sequentielle Vorhersageanalyse mit den kombinierten Daten durchgeführt. Diese Analyse kombinierte Daten sowohl vom Flughafenterminal als auch von Umweltdaten zum 3-Monats-Zeitpunkt und führte die drei ML-Modelle durch, fügte dann den 6-Monats-Zeitpunkt hinzu und so weiter. Die Analyse sollte alle verfügbaren Daten nutzen, um den frühesten Zeitpunkt für die Vorhersage des Erfolgs eines Hundes zu bestimmen (Tabelle 3). Insgesamt schnitten die kombinierten Datensätze bei Berücksichtigung ihrer F1- und AUC-Werte nicht viel besser ab als die einzelnen Datensätze. Die einzigen Fälle, in denen die kombinierten Datensätze etwas besser abschnitten, waren M03 RF gegenüber Environmental M03, M03 + M06 + M09 LR gegenüber Environmental und Airport Terminal M09, alle Daten SVM gegenüber Airport Terminal M12 und alle Daten LR gegenüber Environmental M12. Die F1- und AUC-Werte für die Fälle, in denen die kombinierten sequentiellen Tests keine bessere Leistung erbrachten, zeigten, dass die ML-Modelle bei der Kombination der Datensätze schlechter darin waren, erfolgreiche und ausgeschiedene Hunde zu unterscheiden.

Um die wichtigsten Merkmale für die Erfolgsvorhersage zu jedem Zeitpunkt zu identifizieren, wurden zwei Methoden zur Merkmalsauswahl eingesetzt: Hauptkomponentenanalyse (PCA) und rekursive Merkmalseliminierung mittels Kreuzvalidierung (RFECV). Die PCA wurde anhand der Merkmalsdaten für jeden Test durchgeführt und im Diagramm der Hauptkomponenten 1 und 2 (PC1/2) war keine eindeutige Trennung zwischen akzeptierten und ausgeschiedenen Hunden erkennbar. Es wurden Scree-Plots erstellt, um die prozentuale Varianz zu zeigen, die von jedem PC erklärt wurde, und Heatmaps der beiden besten PCs wurden erstellt, um die Auswirkungen der Merkmale innerhalb dieser PCs zu visualisieren. Innerhalb der Heatmaps waren die obersten oder untersten Merkmale diejenigen, die die größte Varianz innerhalb der jeweiligen Komponente erklärten. RFECV wurde mit Random-Forest-Klassifizierung für jeden Test mit 250 Replikaten verwendet, wobei mindestens ein Merkmal pro Replikat identifiziert wurde. Darüber hinaus wurden 2500 Replikate eines Naive Bayes Classifier (NB) und eines Random Forest Model (RF) erstellt, um Fälle zu identifizieren, in denen RF besser abschneidet als eine naive Klassifizierung.

Gerölldiagramme der Flughafenterminaltests zeigten einen steilen Abfall bei PC2, was darauf hindeutet, dass der Großteil der Merkmalsvarianz durch PC1 erklärt wird. Die durch die beiden besten PCs erklärte Varianz lag zwischen 55,2 und 58,2 %. Die Heatmaps (Abb. 2a) zeigten, dass die PC1/2-Vektoren mit den stärksten Auswirkungen H1/2 nach 3 und 6 Monaten und PP nach 9 und 12 Monaten waren, die beide im oberen linken Quadranten auftraten (d. h , negativ in PC1 und positiv in PC2). Mehrere Merkmale zeigten zeitliche Auswirkungen innerhalb von PCs: (i) nach 3 Monaten hatte PC1 niedrigere H1- als H2-Werte, aber das kehrte sich um und seine Wirkung nahm zu den anderen Zeitpunkten zu; (ii) nach 3 und 6 Monaten hatte PC2 ein positives Signal für H1/2, aber beide wurden nach 9 und 12 Monaten negativ; (iii) nach 3 Monaten war HG negativ, dieser Effekt fehlte jedoch zu anderen Zeitpunkten; (iv) Nach 3 und 6 Monaten hatte PC2 ein negatives Signal für PP, änderte sich jedoch nach 9 und 12 Monaten zu einem stark positiven Signal. Wenn der RFECV mit denselben Flughafentestdaten durchgeführt wurde, wurde ein ähnliches Muster einer zunehmenden Anzahl ausgewählter Merkmale mit fortschreitenden Zeitpunkten beobachtet wie im PCA (Tabelle 4). Wie die PCA-Ergebnisse gehörte H2 zu allen Zeitpunkten mit Ausnahme des 6-Monats-Tests zu den stärksten, obwohl es bei den Replikaten erstmals nach 9 Monaten auftrat. Die Mittelwerte der NB- und RF-Modelle wurden verglichen (Ergänzungstabelle 2) und zeigten, dass die M06- und M12-Ergebnisse für die Klassifizierung am vielversprechendsten waren. Dies deutete darauf hin, dass gemeinsame Merkmale wie alle Besitzmerkmale (MP, IP und PP) und der zweite Jagdtest (H2) für die Identifizierung erfolgreicher Hunde während dieser Tests am wichtigsten sind, die unterschiedliche Art der Bewertung zu jedem Zeitpunkt jedoch schon erlauben keine Längsschnittinterpretation.

Ergebnisse der Hauptkomponentenanalyse (PCA) für Flughafenterminal- (a) und Umwelttests (b). Zu jedem Zeitpunkt wird eine Heatmap angezeigt, die die relative Varianzmenge anzeigt, die von jedem Merkmal innerhalb der beiden wichtigsten Komponenten erfasst wird.

Die PCA-Ergebnisse für die Umwelttests ergaben Geröllfelder, die bei PC2 zu allen Zeitpunkten außer 9 Monaten einen starken Abfall aufwiesen (Abb. 2b). Das Ausmaß der durch die beiden obersten Komponenten erklärten Variation verringerte sich mit zunehmenden Zeitpunkten von 62,7 auf 49,8. Die Heatmaps zeigten, dass der PC1/2-Vektor den stärksten Effekt für das Spielzeugbesitzmerkmal IP hatte, das zu allen Zeitpunkten im oberen linken Quadranten auftrat (CR und PP hatten bei reduzierten Ausmaßen einen ähnlichen Effekt). Zu den PC-Beobachtungen gehörten Folgendes: (i) in PC1 waren Selbstvertrauen und Initiative zu allen Zeitpunkten negativ, und (ii) in PC2 waren Konzentration und Erregbarkeit nach 3 Monaten positiv und stiegen nach 6 und 9 Monaten an 12 Monate. Als der RFECV anhand der Ergebnisse des Umwelttests durchgeführt wurde (Tabelle 4), waren alle Merkmale für 9 und 12 Monate in den Ergebnissen vertreten. Nach 3 Monaten waren nur Selbstvertrauen und Initiative vertreten und nach 6 Monaten nur diese und Reaktionsfähigkeit. Die Mittelwerte der NB- und RF-Modelle wurden ebenfalls verglichen (Ergänzungstabelle 2) und zeigten, dass M03 und M12 für die Klassifizierung am signifikantesten waren. Diese Tests entsprechen dem frühesten Test im Geschenkeladen und dem letzten Test an einem aktiven Flughafenterminal. Zu den primären gemeinsamen Merkmalen gehören Selbstvertrauen und Initiative, wobei Besitz- und Konzentrationsmerkmale zum letzten Zeitpunkt am wichtigsten sind.

In dieser explorativen Studie wurde die Machbarkeit der Verwendung überwachter Ansätze des maschinellen Lernens getestet, um nützliches Wissen aus einem vorhandenen, großen Datensatz von Tests vor dem Training, Verhaltensmerkmalen und Umweltkontexten für Labrador Retriever-Arbeitshunde zu extrahieren. Wir verwendeten 70 % der Hunde zum Lernen und 30 % zum Testen der Vorhersage, welche Hunde in einem Vortrainingsprogramm erfolgreich waren oder aus Verhaltensgründen ausschieden. Die beste Leistung für das Random Forest-Modell haben wir nach 12 Monaten im Airport Terminal-Test gesehen, mit einer Genauigkeit von 87 % und einer AUC – der Fähigkeit, zwischen akzeptierten und ausgeschiedenen Hunden zu unterscheiden – von 0,68. Im Allgemeinen gelten AUC-Werte von 0,5–0,7 als schlecht und 0,7–0,8 als akzeptabel. Der schwächste Messwert für dieses Modell, diesen Test und diesen Zeitpunkt war der Rückruf – die Fähigkeit, alle positiven Fälle zu finden – für ausgeschiedene Hunde von 0,36 (gegenüber 1,0 für akzeptierte Hunde). Dies führte zu einem F1 – dem harmonischen Mittel von Erinnerung und Präzision – von 0,53 (gegenüber 0,92 für akzeptierte Hunde). Eine Überlegung für dieses Ergebnis ist, dass der Flughafen-Terminal-Test im Mittel 73 % der insgesamt 628 Hunde mit Daten über alle Merkmale aufwies (und nur 56 % beim Umwelttest). Ein zweiter Faktor ist die Zuchtselektion, die auf unsere Kohorte und die breiteren Labrador Retriever-Populationen angewendet wird, aus denen sie hervorgegangen ist.

Wir haben zuvor in derselben Kohorte über eine genetische Kartierung der Eliminierung aus Verhaltensgründen berichtet17. Dort haben wir auf die Verhaltensselektion im Zusammenhang mit dieser Kohorte und der allgemeinen Population der Labrador Retriever der „Jagdlinie“ verwiesen. Die Ergebnisse dieser Arbeit zeigten, dass Variationen, die mit problematischem Verhalten verbunden sind und bei Labrador Retrievern als Haustiere häufig vorkommen, in der vorliegenden Kohorte selten sind oder fehlen. Beispielsweise weist ein X-Chromosom-Allel, das mit Angst, Unruhe und Aggression assoziiert ist (wahrscheinlich aufgrund einer Kodierungsvariante in IGSF18,10), eine Allelhäufigkeit von 18 % bei Labrador Retrievern auf, wurde jedoch bei etwa 300 Hunden in dieser Kohorte nicht nachgewiesen . In ähnlicher Weise waren unsere kartierten Haplotypen mit den stärksten Auswirkungen auf die Eliminierung aus Verhaltensgründen tendenziell nur im heterozygoten Zustand vorhanden. Auf diese Weise führt die Zuchtselektion zu einer Verarmung von Allelen, die mit mäßigen bis großen Problemverhaltensweisen einhergehen, die in der allgemeinen Haustierpopulation beobachtet werden; Daher macht eine Verringerung sowohl der Verhaltensvarianz als auch der Eliminierungsraten ihre Entdeckung in spezialisierten Kohorten schwieriger8,9,10.

Die Vorhersageleistungen der Modelle für den Umwelttest waren variabler und schlechter. Die Genauigkeit für das leistungsstärkste logistische Regressionsmodell betrug nach 12 Monaten 80 %. Die AUC betrug 0,60 und die F1s 0,88/0,36 für akzeptierte bzw. ausgeschiedene Hunde (hauptsächlich resultierend aus Recall-Raten von 0,94/0,26). Ein wichtiger Vorbehalt für das logistische Regressionsmodell besteht darin, dass einige Merkmale eine voreingenommene Verteilung in Richtung höherer Bewertungswerte aufwiesen, was die gemeldeten Metriken verzerren kann. Das Muster der Metriken war in den beiden Tests unterschiedlich. Im Airport-Terminal-Test waren alle Top-Metriken für Random Forest nach 12 Monaten und alle die zweitbesten für Logistic Regression nach 12 Monaten. Im Gegensatz dazu hatte der Umwelttest nach 3 Monaten die besten oder zweithöchsten Messwerte für Genauigkeit und akzeptierte Hundepräzision und Erinnerung (und damit F1). Allerdings hatten alle drei Modelle eine Rückrufrate für eliminierte Hunde von 0,05 (und F1 von 0,09–0,10). Dies lässt darauf schließen, dass die Hunde, die am wahrscheinlichsten akzeptiert werden (~ 60 % der Kohorte), anhand von Merkmalen in unseren Daten für 3 Monate erkannt werden können. Dies gilt nicht für die Identifizierung von Hunden, die voraussichtlich eliminiert werden (ca. 25 % der Kohorte; der Rest wird aus medizinischen Gründen eliminiert). Da die Erinnerungsrate eliminierter Hunde zu späteren Zeitpunkten sowohl beim Logistic Regression- als auch beim Random Forest-Modell mehr als fünfmal höher ist, kann es möglich sein, den Entwicklungszeitpunkt der Merkmale zu bestimmen, die für den Erfolg vor dem Training verantwortlich sind.

Die PCA des Umwelttests war über die Zeitpunkte hinweg weniger variabel als die des Flughafenterminaltests. Dies erscheint angesichts der variableren Ergebnisse, die bei der prädiktiven Modellierung des Umwelttests beobachtet wurden, überraschend. Dies ist auch unerwartet, wenn man bedenkt, dass der Umwelttest an verschiedenen Orten durchgeführt wurde, die ausgewählt wurden, um unterschiedliche Arten von Reizen zu präsentieren. Die ersten beiden PCs erklärten einen mit zunehmenden Zeitpunkten abnehmenden Anteil der Varianz, von 62,7 auf 49,8 %. Der stärkste Effekt für die PC1/2-Kombination war für das Spielzeugbesitzmerkmal IP zu verzeichnen, das zu allen Zeitpunkten im oberen linken Quadranten dargestellt ist. Chase/Retrieve und PP hatten ähnliche, aber geringere Auswirkungen. Zu den einzelnen PC-Beobachtungen gehörte, dass Selbstvertrauen und Initiative bei PC1 zu allen Zeitpunkten mäßig bis stark negativ waren. Unter den zeitlichen Effekten in PC2 waren Konzentration und Erregbarkeit nach 3 Monaten schwach positiv und stiegen nach 6 und erneut nach 9 und 12 Monaten leicht an. Die Durchführung des RFECV zeigte, dass alle Merkmale nach 9 und 12 Monaten in den Ergebnissen positiv waren. Selbstvertrauen und Initiative waren zu allen Zeitpunkten vertreten, und Selbstvertrauen hatte die beständigsten hohen Klassifizierungswerte (100, 88,7, 20,7 und 63,3 % in der Reihenfolge zunehmender Zeitpunkte). Nach 3 und 6 Monaten war das Selbstvertrauen am höchsten (100 und 63,3 %). 88,7 %; nach 9 Monaten betrug der IP (93,3 %); und nach 12 Monaten betrug der PP (80,7 %).

Insgesamt waren unsere Algorithmen für maschinelles Lernen bei der Erfolgsvorhersage während eines Vortrainingsprogramms zur Sprengstofferkennung nicht effektiv. Sie zeigten auch eine schlechte Fähigkeit, zwischen erfolgreichen und ausgeschiedenen Hunden richtig zu unterscheiden, was die Anwendung dieser Modelle für den unbeaufsichtigten Einsatz ungeeignet machte. Dies kann zum Teil darauf zurückzuführen sein, dass unseren Daten eine gründliche Dokumentation der Grundlage für die Einstufung oder Entfernung von Hunden fehlt. Dies könnte helfen, die verbesserte Leistung des Algorithmus im Laufe der Zeit zu erklären; Allerdings könnte die Trennung auch auf die Verhaltensentwicklung und das Lernen der Hunde zurückzuführen sein. Auch wenn die AUC-Werte nicht aussagekräftig waren, geben die Klassifizierungsergebnisse Aufschluss über die robustesten Merkmale, die für den Erfolg wichtig sind. Diese Ergebnisse stimmen mit früheren Studien überein, die hauptsächlich PCA und Faktoranalyse verwendeten, um wichtige Merkmale in einer überlappenden Kohorte zu identifizieren, die mehrere Rassen umfasste und in einigen Fällen alle Zeitpunkte kombinierte22. Diese Studien zeigten, dass Reaktionsfähigkeit, Initiative, Selbstvertrauen und Konzentration (mit PC1-Belastungswerten von 0,92, 0,86, 0,81 bzw. 0,67) am meisten zum Erfolg des Hundes bei den Umwelttests beitrugen. Außerdem trugen die Werte „Geistiger Besitz“, „Unabhängiger Besitz“, „Versteckt 1“, „Verborgen 2“ und „Physischer Besitz“ (mit PC1-Belastungswerten von 0,74, 0,66, 0,64, 0,60 und 0,55) am meisten zum Erfolg des Hundes im Flughafenterminaltest bei20,22. Diese Ergebnisse stimmten sowohl mit unseren PCA- als auch mit unseren ML-Klassifizierungsaufgaben überein. Eine andere Studie zeigte ein ähnliches Phänomen von Verschiebungen in der Konsistenz der Ergebnisse (z. B. mit Umweltsicherheit und besitzbezogenen Merkmalen) zwischen Zeitpunkten23 unter Verwendung von PCA. Dieser Trend spiegelt möglicherweise die Entwicklung des Hundeverhaltens im Alter von 3 bis 12 Monaten wider, obwohl dies wahrscheinlich auch die Erfahrung mit den Aufgaben und einige Veränderungen aufgrund der von den Hundeführern in dieser Vorbereitungsphase erwarteten Schulung widerspiegelt.

Diese Studie lieferte einen vorläufigen Einblick in die Vorhersagekraft von ML-Algorithmen zur Auswahl erfolgreicher Labrador Retriever in einem Vortrainingsprogramm zur Geruchserkennung bei Hunden. Die Ergebnisse zeigten, dass eine Teilmenge der Merkmale für die Auswahl erfolgreicher Hunde möglicherweise wichtiger ist als die anderen, was das Potenzial hat, die Merkmalsbewertung im Programm zu vereinfachen. Während die Fähigkeit, zwischen erfolgreichen und verhaltensauffälligen Hunden zu unterscheiden, schlecht war, repräsentieren unsere Daten nur eine kleine Kohorte von Hunden mit wenigen Merkmalen. Unsere Ergebnisse deuten darauf hin, dass es große Möglichkeiten gibt, das Programm durch die Einbeziehung zusätzlicher Verhaltensmerkmale, medizinischer Informationen und anderer Längsschnittdaten zu erweitern.

Die Daten für die Studie stammen aus einem von der TSA im Zeitraum von 2002 bis 2013 durchgeführten Zucht- und Trainingsprogramm für Geruchserkennungshunde. Diese Daten enthielten Ergebnisse für 628 Labrador Retriever, die ab einem Alter von 3 Jahren alle drei Monate zum Testen gebracht wurden Monate während einer 15-monatigen Pflegezeit. Diese Testzeiträume entsprechen einem Zeitraum von 3, 6, 9 und 12 Monaten, in dem zwei separate Tests durchgeführt wurden. Der erste Test, der sogenannte Airport Terminal (AT)-Test, wurde in einem leeren, simulierten Flughafenterminal durchgeführt und sollte das intensive Training simulieren, das die Hunde absolvieren würden, wenn sie das Vortrainingsprogramm bestehen würden. Bei diesem Test führten die Hundeführer die Hunde durch das simulierte Flughafenterminal, machten zwei getrennte Jagden nach einem duftenden Handtuch in Behältern, die über das gesamte Terminal verteilt waren, und beschäftigten sich mit einem Spielzeug. Die Merkmale maßen die Leistung der Hunde bei der Identifizierung des duftenden Handtuchs, die Qualitäten des Hundes während der Aufgaben und den Grad der Auseinandersetzung mit dem Hundeführer, dem Handtuch und dem Spielzeug. Dieser Test sollte zeigen, wie trainierbar der Hund wäre, wenn er erfolgreich wäre.

Der zweite Test, der sogenannte Umwelttest (Env), wurde zu jedem Zeitpunkt an verschiedenen Orten rund um die Basis durchgeführt. Der Test beinhaltete, dass der Hund mit dem Hundeführer an der Leine ging, eine Suche versuchte und sich in einer lauten und überfüllten Umgebung mit einem Spielzeug und dem Hundeführer auseinandersetzte. Zu den Standorten gehörten ein geschäftiger Souvenirladen am Stützpunkt (BX), ein Holzladen mit lauten Geräuschen und dunklen geschlossenen Räumen (Woodshop), ein Frachtbereich mit fließendem Verkehr und Lärm (Airport Cargo) sowie verschiedene Passagierstandorte am Flughafen (Airport Terminal). zu den vier Zeitpunkten. Dieser Test ergänzte den Test des Flughafenterminals, da sich im simulierten Flughafenterminal keine anderen Personen befanden, die die Hunde von der anstehenden Aufgabe ablenken könnten. Der Umwelttest erfasste Merkmale, die verschiedene Eigenschaften der Hunde an diesen stimulierenden Orten und ihre Fähigkeit, sich weiterhin auf die verschiedenen Aspekte des Trainings zu konzentrieren, maßen.

Von den 628 eingeschlossenen Hunden wurde zu jedem Zeitpunkt ein Bruchteil bewertet. Die Werte reichten von 351 bis 564 für die Flughafenterminaltests und von 291 bis 410 für die Umwelttests. Alle Hunde hatten den Status „Akzeptiert“ oder „Ausgeschieden“ aus medizinischen oder verhaltensbezogenen Gründen (ansonsten nicht spezifiziert) und ihre Gesamtzahl ist in der Ergänzungstabelle 1 zusammengefasst. Hunde, die aus medizinischen Gründen ausgeschieden waren, wurden in diese Verhaltensstudie einbezogen, da ihre gesundheitlichen Probleme nicht beschrieben wurden Bei den festgestellten Problemen handelte es sich hauptsächlich um Probleme, die die Lebenserwartung eines Hundes im Programm einschränken (z. B. Hüftdysplasie) und sich nicht unbedingt auf das Verhalten auswirken.

Die Daten für die Hunde wurden nach Art des Tests und Zeitraum aufgeteilt, und Hunde mit erheblichen (> 25 %) fehlenden Ergebnissen wurden für diese Tests ausgeschlossen. Die Verteilungen der Merkmalswerte wurden visualisiert, indem zunächst die Datensätze danach aufgeteilt wurden, ob die Hunde aus Verhaltensgründen akzeptiert oder eliminiert wurden (siehe Code). Die mittlere Punktzahl für jedes Merkmal wurde berechnet und auf einem Radardiagramm mit matplotlib v3.4.2 und plotly v5.3.1, Paketen von Python 3.8.12, dargestellt. Daten und Jupyter Notebook-Code sind unter https://github.com/AWEyre7147/2013TSA-Trait-ML-Project verfügbar.

Das gesamte maschinelle Lernen wurde mit den entsprechenden Toolkits in scikit-learn v0.24.2 mit dem Zufallsstatus 101 durchgeführt, sofern nicht anders angegeben24. Modelle für prädiktives maschinelles Lernen wurden aufgrund ihrer Fähigkeit, binäre Klassifikatoren und einzigartige Möglichkeiten zur Vorhersage zu verarbeiten, ausgewählt. Für Vorhersageaufgaben wurden die Daten mit einer Testgröße von 30 % in Trainings-/Testsätze aufgeteilt. Ein logistisches Regressionsmodell wurde mit Standardeinstellungen ausgeführt. Ein Support Vector Machine-Modell wurde mit Standardeinstellungen ausgeführt. Anschließend wurde versucht, das Modell mithilfe einer Rastersuche mit einem Bereich von C- und Gammawerten zu verfeinern (siehe Code). Ein Random-Forest-Modell wurde mit 100 Schätzern ausgeführt. Die Qualität aller Modelle wurde anhand von Klassifizierungsberichten und der Berechnung der AUC-Statistik bewertet. Die Genauigkeit ist der Prozentsatz korrekt klassifizierter Hunde ((wahre positive Ergebnisse + echte negative Ergebnisse)/(wahre positive Ergebnisse + falsch negative Ergebnisse + echte negative Ergebnisse + falsche positive Ergebnisse). Der Rückruf ist die Fähigkeit eines Klassifikators, alle positiven Fälle zu finden (wahre positive Ergebnisse / ( Falsch-Negative + Wahr-Positive). Präzision ist der Anteil der positiven Vorhersagen, die richtig sind (Wahr-Positive/(Falsch-Positive + Wahr-Positive)). F1 ist das harmonische Mittel aus Erinnerung und Präzision (F1-Score = (2 * Präzisions-Score * Recall Score)/(Precision Score + Recall Score)). Außerdem wurde die Receiver Operating Characteristics (ROC)-Kurve erstellt und die AUC berechnet, also die Fähigkeit eines Modells, zwischen positiven und negativen Klassen zu unterscheiden.

Für Klassifizierungsaufgaben des maschinellen Lernens wurde eine Hauptkomponentenanalyse (PCA) durchgeführt und Gerölldiagramme erstellt, um den durch die Komponenten erklärten Prozentsatz der Varianz zu visualisieren. Die ersten beiden Komponenten wurden ausgewählt, weil sie vor dem Wendepunkt der Geröllplotkurve liegen; Außerdem wurde eine Heatmap erstellt, um zu visualisieren, welche Merkmale die einzelnen Komponenten am stärksten beeinflussten. Um zu ermitteln, welche Merkmale am wichtigsten sind, wurde eine rekursive Merkmalseliminierung mit Kreuzvalidierung (RFECV) unter Verwendung eines Random-Forest-Klassifikatormodells durchgeführt. RFECV wählt mithilfe der Kreuzvalidierung (CV) die optimale Anzahl von Features aus. Wir haben diese Methode verwendet, um zu zeigen, dass die Anzahl und Bedeutung jedes Merkmals mit zunehmender Ausbildung der Hunde zunimmt. Es wurde auf der Suche nach mindestens einem Merkmal und einer Ersatzbewertung basierend auf der Genauigkeit ausgeführt. Anschließend wurde das Bootstrapping 250 Mal mit zufälligen Zuständen im Bereich von 1 bis 250 ausgeführt. Merkmale, die nach jedem Durchlauf ausgewählt wurden, wurden gesammelt, dann wurde der Prozentsatz der Durchläufe ermittelt, in denen jedes Merkmal auftrat in wurde für jeden Test und Zeitraum angegeben. Um eine Grundlage für den Vergleich der RF-Vorhersagegenauigkeiten zu schaffen und die RFECV-Ergebnisse valide zu machen, wurden für jeden Zeitpunkt und Test 250 wiederholte Naive Bayes Classifier- und Random Forest-Läufe berechnet, wobei der Mittelwert und die Standardabweichung mit für jedes Paar berechneten Z-Tests angegeben wurden .

Daten und Computercode sind unter https://github.com/AWEyre7147/2013TSA-Trait-ML-Project verfügbar.

Chambers, RD et al. Deep-Learning-Klassifizierung des Verhaltens von Hunden mithilfe eines einzelnen am Halsband montierten Beschleunigungsmessers: Validierung in der Praxis. Tiere 11(6), 1–19 (2021).

Artikel Google Scholar

Gerencsér, L., Vásárhelyi, G., Nagy, M., Vicsek, T. & Miklósi, A. Identifizierung des Verhaltens bei sich frei bewegenden Hunden (Canis Familiaris) mithilfe von Trägheitssensoren. PLoS ONE 8(10), 1–14 (2013).

Artikel Google Scholar

Fux, A. et al. Objektive videobasierte Beurteilung des ADHS-ähnlichen Verhaltens von Hunden mittels maschinellem Lernen. Tiere 11(10), 1–27 (2021).

Artikel Google Scholar

Menaker, T., Monteny, J., de Beeck, LO & Zamansky, A. Clustering für die automatisierte explorative Mustererkennung in Tierverhaltensdaten. Vorderseite. Tierarzt. Wissenschaft. 9, 1–12 (2022).

Artikel Google Scholar

Cleghern, Z., et al. Verhaltens- und Umweltanalysen potenzieller Blindenhunde mit IoT-Sensordaten auf Basis von Expert Insight. Proceeding Series der ACM International Conference, August 2021. (2020).

Jenkins, JR, Caballero, WN & Hill, RR Vorhersage des Erfolgs in der Pilotenausbildung der US-Luftwaffe mithilfe von Techniken des maschinellen Lernens. Sozioökon. Plann. Wissenschaft. 79, 1–14 (2022).

Artikel Google Scholar

Ostrander, EA, Wayne, RK, Freedman, AH & Davis, BW Demografische Geschichte, Selektion und funktionelle Vielfalt des Hundegenoms. Nat. Rev. Genet. 18(12), 705–720 (2017).

Artikel CAS PubMed Google Scholar

Zapata, I., Serpell, JA & Alvarez, CE Genetische Kartierung von Angst und Aggression bei Hunden. BMC Genomics 17(1), 1–21 (2016).

Artikel Google Scholar

MacLean, EL, Evan, L., Snyder-Mackler, N., vonHoldt, BM & Serpell, JA Hochvererbbare und funktionell relevante Rassenunterschiede im Hundeverhalten. Proz. R. Soc. B 286, 1–9 (2019).

Artikel Google Scholar

Zapata, I., Hecht, EE, Serpell, JA und Alvarez, CE Genomscans des Hundeverhaltens deuten auf ein Gennetzwerk hin, das der Psychopathologie bei Säugetieren, einschließlich Menschen, zugrunde liegt. BioRxiv https://doi.org/10.1101/2020.07.19.211078 (2021).

Artikel Google Scholar

Bray, EE et al. Verbesserung der Auswahl und Leistung von Arbeitshunden. Vorderseite. Tierarzt. Wissenschaft. 8, 430 (2021).

Artikel Google Scholar

Otto, CM et al. AAHA-Richtlinien für Arbeits-, Assistenz- und Therapiehunde. Marmelade. Anim. Hosp. Assoc. 57, 253–277 (2021).

Artikel PubMed Google Scholar

Sakr, R. et al. COVID-19-Erkennung bei Hunden: Von der Physiologie zur Feldanwendung – ein Übersichtsartikel. Postgraduiertenstudium. Med. J. 98, 212–218 (2022).

Artikel PubMed Google Scholar

Nationales Diensttierregister (2022). Wie viel kostet ein Diensthund? Ein Kaufratgeber für Ihren Diensthund. https://www.nsarco.com/how-much-does-a-service-dog-cost-a-buyers-guide-for-your-service-dog/

Chen, FL et al. Förderung der genetischen Selektion und Verhaltensgenomik von Arbeitshunden durch gemeinsame Wissenschaft. Vorderseite. Tierarzt. Wissenschaft. 8. (September), 1–14 (2021).

ADS Google Scholar

MacLean, EL & Hare, B. Verbesserte Auswahl von Assistenz- und Sprengstoffspürhunden mithilfe kognitiver Maßnahmen. Vorderseite. Tierarzt. Wissenschaft. 5, 236 (2018).

Artikel PubMed PubMed Central Google Scholar

Eyre, AW et al. Genom-Scanning der Verhaltensselektion in einer Zuchtkohorte zur Geruchserkennung bei Hunden. Wissenschaft. Rep. 12(1), 1–12 (2022).

Artikel Google Scholar

Champness, KA Entwicklung eines Zuchtprogramms für Drogenspürhunde (S. 1–314) (1996).

Fratkin, JL et al. Siehst du was ich sehe? Können Laien mit minimaler Ausbildung Expertenbewertungen bei der Verhaltensbeurteilung von Arbeitshunden reproduzieren? Verhalten. Proz. 110 (SEPTEMBER), 105–116 (2015).

Artikel Google Scholar

McGarrity, ME, Sinn, DL, Thomas, SG, Marti, CN & Gosling, SD Vergleich der prädiktiven Validität von Verhaltenskodierungen und Verhaltensbewertungen in einem Zuchtprogramm für Arbeitshunde. Appl. Anim. Verhalten. Wissenschaft. 179, 82–94. https://doi.org/10.1016/j.applanim.2016.03.013 (2016).

Artikel Google Scholar

Munch, KL, Wapstra, E., Thomas, S., Fisher, M. & Sinn, DL Was messen wir? Anfänger sind sich untereinander (aber nicht immer mit Experten) in ihrer Einschätzung des Hundeverhaltens einig. Ethologie 125(4), 203–211 (2019).

Artikel Google Scholar

Sinn, DL, Hixon, G. & Gosling, SD (o.d.). Erstellt für das Direktorat des US-Heimatschutzministeriums, Wissenschaft und Technologie, Vertrag HSHQDC-10-C-00085: „Verbesserung der Wirksamkeit der Auswahl und Ausbildung von Spürhunden durch Messung von Verhalten und Temperament.“

Sinn, DL, Gosling, SD & Hilliard, S. Persönlichkeit und Leistung bei militärischen Arbeitshunden: Zuverlässigkeit und prädiktive Validität von Verhaltenstests. Appl. Anim. Verhalten. Wissenschaft. 127(1–2), 51–65 (2010).

Artikel Google Scholar

Pedregosa, F. et al. Scikit-learn: Maschinelles Lernen in Python. J. Mach. Lernen. Res. 12, 2825–2830 (2011).

MathSciNet MATH Google Scholar

Referenzen herunterladen

Wir danken der Leitung und den Mitarbeitern des TSA National Explosives Detection Canine Program, Lackland AFB, für die Bereitstellung von Informationen und Zugang zu ihrem Programm. Wir danken der Leitung des Department of Defense Military Working Dog Veterinary Service (Armee), Lackland AFB, für Diskussionen und Informationen. Die Daten wurden im Rahmen einer kooperativen Forschungs- und Entwicklungsvereinbarung zwischen dem Department of Homeland Security und der University of Pennsylvania (Aktenzeichen DHS-2013-0064) zur Verfügung gestellt.

Diese Arbeit wurde vom Department of Homeland Security Science and Technology (S&T) Directorate, Vertrag Nr. 70RSAT19CB0000014 mit dem Battelle Memorial Institute (Hauptforscher CEA, CMO, JAS; und AWE, IZ und EH) unterstützt. CEA wurde auch durch Zuschüsse des American Kennel Club CHF (01660) und des Scottish Deerhound Club of America unterstützt. Die Daten wurden durch eine kooperative Forschungs- und Entwicklungsvereinbarung 14-EXD-002 zwischen dem Penn Vet Working Dog Center und dem Department of Homeland Security Science and Technology Directorate zur Verfügung gestellt.

Zentrum für klinische und translationale Forschung, Abigail Wexner Research Institute am Nationwide Children's Hospital, Columbus, OH, 43205, USA

Alexander W. Eyre

Abteilung für Biomedizinische Wissenschaften, Rocky Vista University College of Osteopathic Medicine, Parker, CO, 80134, USA

Issain Zapata

Dog Genetics LLC, Astoria, NY, 11102, USA

Elizabeth Hare

Penn Vet Working Dog Center, Abteilung für klinische Wissenschaften und fortgeschrittene Medizin, School of Veterinary Medicine, University of Pennsylvania, Philadelphia, PA, 19146, USA

Elizabeth Hare und Cynthia M. Otto

Abteilung für klinische Wissenschaften und fortgeschrittene Medizin, School of Veterinary Medicine, University of Pennsylvania, Philadelphia, PA, 19104, USA

James A. Serpell

Abteilungen für Pädiatrie und Veterinärklinische Wissenschaften, The Ohio State University Colleges of Medicine and Veterinary Medicine, Columbus, OH, 43210, USA

Carlos E. Alvarez

Sie können diesen Autor auch in PubMed Google Scholar suchen

AWE entwarf und führte die Analysen mit Beiträgen von IZ und CEAEH durch, generierte und verarbeitete den TSA-Datensatz. CMO, JAS und EH stellten Fachwissen zum Verhalten von Hunden und Arbeitshunden zur Interpretation und Diskussion zur Verfügung. AWE und CEA haben den Großteil des Manuskripts mit Hilfe von IZ sowie Beiträgen und Redaktion von EH, CMO und JAS geschrieben

Korrespondenz mit Carlos E. Alvarez.

Die Autoren geben an, dass keine Interessenkonflikte bestehen.

Springer Nature bleibt neutral hinsichtlich der Zuständigkeitsansprüche in veröffentlichten Karten und institutionellen Zugehörigkeiten.

Open Access Dieser Artikel ist unter einer Creative Commons Attribution 4.0 International License lizenziert, die die Nutzung, Weitergabe, Anpassung, Verbreitung und Reproduktion in jedem Medium oder Format erlaubt, sofern Sie den/die ursprünglichen Autor(en) und die Quelle angemessen angeben. Geben Sie einen Link zur Creative Commons-Lizenz an und geben Sie an, ob Änderungen vorgenommen wurden. Die Bilder oder anderes Material Dritter in diesem Artikel sind in der Creative Commons-Lizenz des Artikels enthalten, sofern in der Quellenangabe für das Material nichts anderes angegeben ist. Wenn Material nicht in der Creative-Commons-Lizenz des Artikels enthalten ist und Ihre beabsichtigte Nutzung nicht gesetzlich zulässig ist oder über die zulässige Nutzung hinausgeht, müssen Sie die Genehmigung direkt vom Urheberrechtsinhaber einholen. Um eine Kopie dieser Lizenz anzuzeigen, besuchen Sie http://creativecommons.org/licenses/by/4.0/.

Nachdrucke und Genehmigungen

Eyre, AW, Zapata, I., Hare, E. et al. Vorhersage und Klassifizierung der Verhaltensselektion durch maschinelles Lernen in einem Geruchserkennungsprogramm für Hunde. Sci Rep 13, 12489 (2023). https://doi.org/10.1038/s41598-023-39112-7

Zitat herunterladen

Eingegangen: 17. Februar 2023

Angenommen: 20. Juli 2023

Veröffentlicht: 01. August 2023

DOI: https://doi.org/10.1038/s41598-023-39112-7

Jeder, mit dem Sie den folgenden Link teilen, kann diesen Inhalt lesen:

Leider ist für diesen Artikel derzeit kein gemeinsam nutzbarer Link verfügbar.

Bereitgestellt von der Content-Sharing-Initiative Springer Nature SharedIt

Durch das Absenden eines Kommentars erklären Sie sich damit einverstanden, unsere Nutzungsbedingungen und Community-Richtlinien einzuhalten. Wenn Sie etwas als missbräuchlich empfinden oder etwas nicht unseren Bedingungen oder Richtlinien entspricht, kennzeichnen Sie es bitte als unangemessen.