Proč je tato výměna důležitá pro biologické vědy napříč Evropou
- Iniciativa byla postavena na třech hlavních cílech:
- posílení portfolia interoperabilních nástrojů a služeb,
- usnadnění přenosu znalostí mezi jednotlivými obory,
- zlepšení komunikace mezi komunitami metabolomiky a toxikologie.
V jejím jádru stojí Adverse Outcome Pathway (AOP) — způsob reprezentace biologických dat za účelem objasnění, jak chemikálie vede k nepřiznivému účinku na zdraví.Propojením přístupů založených na AOP s nástroji metabolomiky chtějí týmy umožnit komplexnější analýzy spojující chemickou expozici, molekulární změny a biologické účinky.
Od sladění k interoperabilitě
Namísto vývoje zcela nových řešení se diskuse soustředila na prohloubení propojení mezi již existujícími nástroji. Klíčovou roli zde hrály technologie jako BridgeDb, IDSM, MSMetaEnhancer, WikiPathways a FixID, přičemž důraz byl kladen na posun od základní kompatibility k plné interoperabilitě.
Jedním ze slibných směrů je například prohledávání AOP databázi zapomoci dat z hmotnostní spektrometrie (MS) prostřednictvím integrací mezi IDSM a AOP-Wiki-RDF. Toto má za účel výrazné zjednodušení propojení experimentálních metabolomických dat s daty toxikologickými.
Mimo mapování identifikátorů a sladění ontologií účastníci také zkoumali možnosti využití nástrojů pro integraci dat založených na umělé inteligenci. Uplatnění se zabývalyanalýzou textu (např. za pomocí AOPTK), ale i analýzou obrazu (např. PFOCR). což je důkazem, že automatizace může pomáhat při interpretaci komplexních biologických dat a zavádění postupů v souladu s principy FAIR.
Praktická spolupráce a konkrétní kroky
Výměna nesla praktický charakter. Práce byla zaměřená na zlepšení a rozšíření konkrétních nástrojů:
- MSMetaEnhancer je rozšiřován o nové možnosti převodu identifikátorů, integraci s BridgeDb a vylepšené rozpoznávání chemických názvů, včetně napojení na službu OPSIN a databázi Wikidata.
- AOPTK, Python balíček pro analýzu toxikologické vědecké literatury pomocí velkých jazykových modelů (LLM) , směřuje k výstupům zohledňující identifikátory, integraci se službami mapování ontologií (např., ZOOMA) a podpoře formátu nanopublikací. Vývoj zahrnuje také začlenění dat z AOP-Wiki, čímž doplňuje stávající integraci databází jako PubMed, PubMed Central a Europe PMC.
- SPARQL endpointy poskytují přístup k AI-ready biologickým datům prostřednictvím sémantického webu, který podporuje i internetové stránky. Tyto endpointy vytvářejí LinkedOpen Data znalostní graf propojující různé databáze harmonizací identifikátorů prostřednictvím BridgeDb.
Galaxy nástroje jsou rozšiřovány o napojení na SPARQL, výpočty strukturní podobnosti a plánovanou integraci s BioDataFuse, což umožní flexibilnější a škálovatelnější využití.
Tyto aktivity odrážejí společnou prioritu: vytvářet nástroje, které jsou interoperabilní, snadno použitelné v praxi a dostatečně škálovatelné pro zodpovězení nových výzkumnýchotázek.
Měřitelný dopad a propojenější ekosystém ELIXIR
Spolupráce již nyní formuje nové směry výzkumu. Plánované benchmarking studie budou hodnotit, jak dobře si různé nástroje vedou v rozpoznávání pojmenovaných entit (NER) pro malé molekuly, v rozlišování identifikátorů a v analýze strukturní podobnosti. Tyto aktivity přinesou potřebné poznatky o tom, jak se interpretace dat liší v závislosti na použitých nástrojích a identifikátorech — což je zásadní otázka pro reprodukovatelnost výsledků.
To, co činí tuto výměnu obzvlášť hodnotnou, je její širší dopad. Snižováním roztříštěnosti a slaďováním nástrojů a standardů pomáháme oběma uzlům fungovat efektivněji a zároveň ukazujeme, jak sdílená infrastruktura, otevřená spolupráce a důraz na principy FAIR může činit mezioborový výzkum efektivnějším v praxi.