Herausforderung & Lösung
In der Gründungsphase konnte die Firma auf institutionelle High-Performance-Computing (HPC) Ressourcen zurückgreifen. Als der Analysebedarf stieg und Allcyte sich zu einer unabhängigen Firma entwickelte, wurde die Bildanalyse auf die Google Cloud Platform (GCP) ausgelagert. Seit 2017 hat Allcyte Millionen von Bildern von Patientenproben analysiert, um die voraussichtliche klinische Wirksamkeit einer großen Anzahl von Krebsbehandlungen zeitgleich zu ermitteln -- vor dem Start kostenintensiver und risikobehafteter klinischer Studien.
Über Allcyte
Allcyte ist ein Biotech-Unternehmen, das fortgeschrittene Mikroskopie mit künstlicher Intelligenz verbindet, um die Krebsforschung voranzutreiben und so die Entwicklung neuer Medikamente unterstützt. Allcyte's innovative Pharmacoscopy®-Plattform ermöglicht es, die Wirksamkeit von Krebsmedikamenten auf der Einzelzellebene abzuschätzen. In Zusammenarbeit mit CLOUDPILOTS und Google implementierte Allcyte einen flexiblen GPU-Cluster, um die nächste Generation AI-gestützter Hochdurchsatzmikroskopie und Bildanalyse umzusetzen
Allcyte: Kombination von Einzelzellmikroskopie und AI...
...zum Profiling von Krebsmedikamenten in primären menschlichen Geweben.
Allcyte's innovative Pharmacoscopy®-Plattform ermöglicht es, die Wirksamkeit von Krebsmedikamenten auf der Einzelzellebene abzuschätzen. In Zusammenarbeit mit CLOUDPILOTS und Google implementierte Allcyte einen flexiblen GPU-Cluster, um die nächste Generation AI-gestützter Hochdurchsatzmikroskopie und Bildanalyse umzusetzen.
Allcyte’s Pharmacoscopy®-Plattform:
- Erfasst, speichert und analysiert jedes Jahr mehr als 100 Terabyte Bilddaten.
- Setzt dank Kubernetes Cluster Autoscaling die Analyse auf schnelle, zuverlässige und bedarfsgerechte Weise um.
- Ermöglicht reproduzierbare Analysen sowie fortlaufende Verbesserungen durch Einsatz des Cloud Build Continuous Integration Systems.
Das Biotech-Startup Allcyte erfasst und analysiert zehntausende Mikroskopiebilder pro Stunde von Krebszellen direkt in menschlichen Gewebeproben, um eine Vorschau auf die Effektivität von Krebsmedikamenten in individuellen Patienten zu ermöglichen.
Allcyte wurde als Spin-off des Forschungszentrums für Molekulare Medizin (CeMM) der Österreichischen Akademie der Wissenschaften gegründet. In der Gründungsphase konnte die Firma auf institutionelle High-Performance-Computing (HPC) Ressourcen zurückgreifen. Als der Analysebedarf stieg und Allcyte sich zu einer unabhängigen Firma entwickelte, wurde die Bildanalyse auf die Google Cloud Platform (GCP) ausgelagert. Seit 2017 hat Allcyte Millionen von Bildern von Patientenproben analysiert, um die voraussichtliche klinische Wirksamkeit einer großen Anzahl von Krebsbehandlungen zeitgleich zu ermitteln -- vor dem Start kostenintensiver und risikobehafteter klinischer Studien. Gestützt durch immer realistischere, patientenzentrierte Modelle hat sich die Pharmacoscopy® als ein effektives Werkzeug in den frühen Phasen des Wirkstoffentwicklungsprozesses sowie der Präzisionsmedizin bewährt.
2019 war Allcyte’s Computational Team bereit für die nächste Herausforderung: wie kann Pharmacoscopy über den Blutkrebs hinaus auf vielschichtige Krebsindikationen angewendet werden? Disseminierte Tumorzellen (DTC) können im Verlauf mehrerer Krebsindikationen auftreten, einschließlich Pankreas-, Eierstock- und Lungenkrebs. Während Blutkrebszellen aber homogen sind und daher mit bewährten klassischen Bildanalysemethoden analysiert werden können, sind DTC morphologisch sehr durchmischt. Dies erfordert die präzise Erkennung komplexer Objekte im Hochdurchsatzverfahren; eine Aufgabe, für die moderne Region-based Convolutional Neural Networks (R-CNNs) ideal geeignet sind. Die Entwicklung dieser AI-Lösungen für die Pharmacoscopy® erforderte das schnelle Prototyping und die Bereitstellung einer neuartigen, GPU-basierten Analysepipeline in der Cloud.
Schneller Übergang vom Prototypen zum Einsatz
Die hohe Anpassungsfähigkeit der GCP - vom Analyseprototypen zur Inbetriebnahme - ist ein wesentlicher Vorteil gegenüber traditioneller, lokaler IT-Infrastruktur. Nach dem raschen Einrichten der Entwicklungsinfrastruktur konnten Allcyte’s Forscher dank Google Workspace und Cloud Storage innerhalb weniger Tage bereits auf vorhandene Daten zugreifen und die Arbeit aufnehmen.
„Verglichen mit unflexiblen lokalen Lösungen war unser größtes Anliegen mit der GCP, neue Analyseströme schnell skalieren zu können. Im Gegensatz zu klassischen Bildanalyselösungen erforderte die neu entwickelte Deep-Learning-Plattform für die Analyse disseminierter Tumorzellen GPU-fähige Hardware. Durch die Umsetzung in der Cloud mit Kubernetes konnten wir schnell und ohne große Vorabinvestition die neue Architektur testen und zum Einsatz bringen. Die Arbeit in der Cloud hat Forschung und Entwicklung bei Allcyte enorm unterstützt.“
Bald darauf war ein Prototyp einsatzbereit: Mit R-CNNs konnten Bilder komplexer DTC-Zellproben mit hoher Genauigkeit auf einer einzelnen GPU-Maschine analysiert werden: 9600 Bilder alle zwei Stunden. Um das Ziel zu erreichen, hunderttausende von Bildern innerhalb weniger Stunden zu analysieren, arbeitete der Allcyte Datenwissenschaftler Florian Rohrer mit CLOUDPILOTS zusammen, um den Prototypen in eine skalierbare Clusterlösung zu übersetzen.
Flexible Cluster mit unbegrenzter Skalierung
Die neue DTC-Analysepipeline von Allcyte war aufgrund der Stoßweisen, anspruchsvollen Arbeitslast nicht für herkömmliche HPC-Umgebungen geeignet: Für eine lokale Lösung wäre es erforderlich gewesen, jederzeit überschüssige Kapazitäten aufrechtzuerhalten. Durch die Cloud-basierte Kubernetes-Lösung können Daten direkt von ihrem Standort in der Cloud abgerufen werden, während sich die verwendeten Maschinen flexibel im hochparallelen Betrieb ohne Netzwerkengpässe skalieren lassen. Durch die automatische Clusterskalierung können Dutzende von leistungsstarken GPU-Computern bei Spitzenanforderungen abgerufen und im Standby auf eine einzelne Maschine reduziert werden.
Neben den Leistungsanforderungen der Analyse stellt Allcyte hohe Anforderungen an Rückverfolgbarkeit und Reproduzierbarkeit. Gleichzeitig sollen kontinuierlich verbesserte Versionen von AI-Modellen nachvollziehbar sein. Um den Überblick zu behalten, setzt Allcyte auf die integrierte Überwachung durch Stackdriver. Zusätzlich erleichtert Cloud Build den Entwicklungs-, Integrations- und Bereitstellung-Zyklus, sodass eine neue Version der Software auf Github innerhalb weniger Minuten in eine einsatzfähige Form gebracht werden kann. Als Resultat wird somit jede einzelne Analyse nachverfolgbar und ist bis hinunter auf die spezifische Version der Softwareumgebung durchgängig reproduzierbar.
Zukunftsaussichten
Die Veröffentlichung der DTC Pharmacoscopy® Pipeline repräsentiert die zweite umfangreiche Innovation der Allcyte Analyseinfrastruktur innerhalb der letzten zwei Jahre. Da das Unternehmen seinen Anwendungsbereich immer weiter ausbaut, wird die Fähigkeit, neue Analyseströme schnell zu entwickeln und bereitzustellen ein Schlüsselfaktor für den Erfolg sein. Als datengetriebenes Unternehmen entwickelt Allcyte auch seine Datenspeicherinfrastruktur kontinuierlich weiter. Google Cloud Storage bietet dafür eine robuste, leistungsstarke Grundlage. In der Zukunft möchte Allcyte darüber hinaus Data Warehousing Lösungen wie Big Query nutzen, um die Resultate der Pharmacoscopy® Pipeline direkt für die Integration mit weiteren Analyseströmen verfügbar zu machen - und damit wertvolle Einblicke in die Mechanismen und Wirksamkeit neuartiger Krebsmedikamente zu erzielen.