Herausragende Medizinprodukte erfordern leidenschaftliche Macher*innen: Hinter unserer einzigartigen 3D-Mobilitäts-App steckt ein interdisziplinäres Team mit mehr als 50 Köpfen. In unserer Blogbeitragsreihe People@Lindera stellen wir die verschiedenen Expert*innen vor. Heute tauchen wir ein in die Welt der Datenwissenschaftlerin Bowen Zhou.
Bevor sie sich der Mission von Lindera angeschlossen hat, um Präzisions- und Präventionsmedizin allen Menschen zugänglich zu machen und die Grenzen der menschlichen Bewegung zu erweitern, forschte sie am KIT – Karlsruher Institut für Technologien im Bereich Robotics. Warum sie ihre Forschungsassistenz an den Nagel gehängt und sich stattdessen für den Einstieg beim Berliner MedTech-Unternehmen hat, um die datengestützte Transformation der Gesundheitsversorgung voranzutreiben, berichtet sie uns im Interview:
Bowen, du bist Datenwissenschaftlerin. Womit genau beschäftigst du dich?
Ich nutze Techniken des maschinellen Lernens und Algorithmen aus dem Bereich der Computer Vision, um 2D- und 3D-Schätzung der menschlichen Pose zu erstellen. Konkret trage ich Sorge für die Präzision und Zuverlässigkeit unserer auf künstlicher Intelligenz basierenden, digitalen Mobilitätsanalyse. Ich stelle also sicher, dass die 2D-/3D-Schätzung der menschlichen Pose, die unsere Software erfasst, noch genauer wird.
Von wem bekommst du deine Datensätze? Welche Daten verarbeitest du?
Wenn ich Menschen von meinem Job erzähle, denken viele erstmal, dass ich den ganzen Tag Personen beim Gehen aufzeichne, um Daten zu sammeln. Das ist, Gott sei Dank, nicht der Fall. Für Schätzungen der menschlichen Pose gibt es bereits weit verbreitete Open-Source-Datensätze. Beispiele dafür sind die Datensätze Microsoft Common Objects in Context (COCO) für zweidimensionale Abbildungen sowie Human3.6M.
Letzteres ist der am weitesten verbreitete Indoor-Datensatz für 3D-Human Pose Estimation aus monokularen Bildern und Videos. Unser Team hat mit Human3.6M gearbeitet, um ein neuronales Netzwerk zu trainieren. Derzeit habe ich mit Motion-Capture-Daten, also Daten aus der Bewegungserfassung, eine neue Trainingsrunde erarbeitet. Der Vorteil an solchen Open-Source-Datensätzen liegt in der Strukturiertheit der Daten, Menge der verfügbaren Daten und der enthaltenen Datenpunkte. Öffentliche Datensätze stehen obendrein allen offen und tragen damit viel zu Forschung und Entwicklung bei.
Datensicherheit ist ein heikles Thema im Gesundheitswesen. Wie stellst du sicher, dass die sensiblen Daten der Menschen bei euch sicher bleiben?
Wir nehmen unsere Aufgabe in puncto Datenschutz sehr ernst und halten uns streng an alle Anforderungen im Bereich der Datensicherheit für digitale Gesundheitsanwendungen. Auf diese Weise gewährleisten wir die Sicherheit der personenbezogenen Daten.
Woran arbeitest du gerade?
Zurzeit arbeite ich an einem Algorithmus zur Schätzung der menschlichen 3D-Position und an einer Pipeline zur 2D-Positionsverfolgung für unsere LTech-Produkte. Mit unserem LTech-Software-Development-Kit (LTech-SDK) können Anbieter von Fitness- und Gesundheits-Apps ihren Nutzer*innen ein personalisiertes Trainingsfeedback bieten.
Möglich ist das durch Deep Learning und dafür braucht es weder Multi-Kamera-Systeme noch komplexe Tiefensensoren – sondern lediglich unsere Technologie in Form des LTech-SDK und eine handelsübliche Smartphone- oder Tablet-Kamera. Wer mit einer solchen Anwendung trainiert, erhält ein direktes Feedback via App über die Ausführung von Bewegungen. Wir haben mit dieser Lösung einen echten Coup gelandet.
Warum ist es für unsere Gesundheit wichtig, datengestützter zu arbeiten?
Eine datengestützte Gesundheitsversorgung ist unsere Zukunft. Die Entwicklung dahin zeichnet sich international bereits ab. Es gibt eine wachsende Zahl von SDK- und Plattformangeboten. Auf der HIMSS Global Health Conference & Exhibition haben wir uns davon selbst ein Bild machen können. Privat leben wir längst in einer datengesteuerten Welt.
Mit Mobiltelefonen, Smartwatches und anderen Wearables können wir eine Vielzahl von Informationen und Daten zu unserer Gesundheit und auch körperlichen Aktivitäten sammeln – und entsprechend weiterverwerten. Das Problem ist: Bisher nutzen wir diese Daten noch zu wenig. Dabei steckt sehr viel Potenzial zur Prävention und Früherkennung von gesundheitlichen Anomalien in ihnen.
Für Datenwissenschaftler*innen wie mich ist der Status Quo schon jetzt ein wahres Datenparadies. Aufgrund der Vielzahl an mobilen Geräten habe ich die Chance, viele Daten zu analysieren, um eine klarere Vorstellung von den Gesundheits- und Fitnessbedürfnissen zu bekommen und konkrete Rückschlüsse zu ziehen – beispielsweise für die Qualität der Betreuung in der Pflege.
Mit den Ergebnissen meiner Arbeit können Senior*innen ihre Mobilität gezielt verbessern, indem sie über ihre Haltung, ihr Gangbild und Sturzrisiken aufgeklärt werden. Das ist ganz einfach über die Auswertung eines Videos vom Gang einer Person, für die ich die Algorithmen auf die verschiedenen Gangparameter trainiere. Ergänzend dazu arbeiten wir mit einem Fragebogen.
Warum ist es wichtig, dass alle Menschen „datenkompetent“ sind?
Datenkompetenz bedeutet erstmal nichts anderes, als dass eine Person in der Lage ist, Daten zu lesen, zu nutzen, zu analysieren und zu hinterfragen. Der Schwerpunkt der Datenkompetenz sollte dabei nicht auf Mathematik, Algorithmen oder Technik liegen. Vielmehr sollte sie sich auf jeden Einzelnen von uns beziehen. Es liegt auf der Hand, dass Datenkompetenz für Unternehmen und Betriebe wichtig ist.
Denn nur ein Team, das über ausreichende Datenkompetenz verfügt, ist in der Lage, mit verschiedenen Datenquellen umzugehen und zu wissen, was die Daten aussagen können, und kontinuierliche Einblicke und Entscheidungshilfen zu liefern. Wir können sagen, dass Datenkompetenz bei Lindera heute weit mehr ist als eine mathematische Fähigkeit – Datenkompetenz ist eine Lebens- und Arbeitsfähigkeit.
Welche Kennzahlen oder Metriken sind für dich am aussagekräftigsten und weshalb?
Das ist eine interessante Frage! In der Computer Vision wird häufig die Präzision oder Genauigkeit verwendet – und auch ich arbeite am liebsten mit dieser Metrik. Diese und auch andere Metriken dienen als Maßstab für die Leistung eines neuronalen Netzwerkmodells oder eines Algorithmus, d. h. sie bestimmen den Prozentsatz der korrekten Vorhersagen.
Welches Tool nutzt du als Datenwissenschaftlerin am liebsten?
PyTorch ist definitiv mein Lieblingswerkzeug. Es handelt sich dabei um ein Open-Source-Framework für maschinelles Lernen. Wir verwenden dieses Framework häufig bei unserer Arbeit. PyTorch ist tief in Python integriert, so dass sich viele Python-Debugging-Tools problemlos mit ihm verwenden lassen. PyTorch hat zudem – genau wie die Sprache Python – eine intuitive Syntax und ist daher relativ leicht zu erlernen. Für Bereichsfremde mag das jetzt sehr Spanisch klingen. 😊
Mit all den Erfahrungen, die du an der Universität gesammelt hast: Warum gibst du jeden Tag Lindera dein Ja, anstatt in der Akademie weiterzuforschen?
Ich habe für mich entschieden, dass ich es für sinnvoller halte, Technologie auf reale Produkte anzuwenden und einen direkten Mehrwert für unsere Gesellschaft zu schaffen, als in der akademischen Welt weiterzuforschen. Was wir heute tun, hilft nicht nur den Senior*innen, sondern in der Zukunft auch uns selbst.
Mobilität bedeutet für dich…
… die Zukunft.
Welche Fähigkeiten und Eigenschaften müssen Bewerber*innen mitbringen, die das Data-Science-Team verstärken wollen?
Wir suchen Menschen, die kreativ und mutig sind und Erfahrungen in der Computer Vision haben, z.B. mit 2D/3D-Schätzern und in der Ganganalyse. Wer bei uns arbeiten möchte, sollte Lust haben, im Team und interdisziplinär mit verschiedenen Abteilungen zusammenzuarbeiten. Bei Lindera verstehen wir uns alle als eine Kraft, die in dieselbe Richtung arbeitet. Initiativbewerbungen einfach per E-Mail an hello@lindera.de
Mehr erfahren über das Lindera-Team: