Adolf, Stephan
(2022)
Fine-Grained Visual Categorization von Vögeln auf Bildern mittels Deep Learning.
Masters, Carl von Ossietzky Universität Oldenburg.
Abstract
In dieser Arbeit ist die Klassifikation von Vogelbildern mittels eines vortrainierten Inception-v3 CNN's durchgeführt worden. Dazu wurden die Hyperparameter der Modelle für die Literaturdatensätze CUB-200-2011, BirdSnap, NAbirds sowie die Vögelteilmenge des iNat Datensatzes mit dem KerasTuner optimiert.
Ferner ist ein Hyperparametertransfer auf Basis eines stufenweisen Hyperparametertunings entwickelt worden, welches in einigen Experimenten vergleichbare Resultate erzielt hat wie das optimierte Hyperparametertuning. Dafür ist der Hyperparametertransfer insbesondere für sehr große Datensätze (in dieser Arbeit ein Vogel-Datensatz von naturgucker.de) geeignet, wo ein Hyperparametertuning einen zu hohen Rechenaufwand darstellen würde.
Des Weiteren sind Techniken zum Umgang mit dem class imbalance problem untersucht worden. Bei einigen Experimenten haben diese Techniken bessere Resultate als das Basiscnn erzielt. Dennoch spielt das class imbalance problem in diesen Versuchen eine untergeordnete Rolle, da sich insbesondere für die Literaturdatensätze kein deutlicher Zusammenhang zwischen der Klassengröße und der Vorhersagegenauigkeit zeigen lässt.
Als weitere Optimierung der Klassifikation wurden mehrere Techniken zum Ausschneiden von Vögeln aus Bildern mittels Bounding Box Informationen vorgeschlagen. Insbesondere ist untersucht worden, ob hierzu neben entsprechenden teilweise verfügbaren Annotationen auch Vorhersagen durch eine Objekterkennung mittels YOLO nutzbar sind. Für die Datensätze CUB-200-2011, BirdSnap und NAbirds konnten zum Teil Verbesserungen erzielt werden. Für die Datensätze iNat und naturgucker.de ergeben sich jedoch deutliche Verschlechterungen in der Vorhersagegenauigkeit.
Actions (login required)
|
View Item |