Chemická informatika

Cílem tohoto projektu je vytvořit standardní formát pro sdílení a výměnu experimentálních dat. Vychází z projektu IUPAC-CODATA Task Group on Standardization of Physico-Chemical Property Electronic Data Files. Data by měla být dostupná z Internetu prostřednictvím centrálního portálu DataExplorer. Přestože projekt již oficiálně skončil, jeho vývoj neustále pokračuje.

Veškeré nástroje musí být zdarma, v otevřeném zdrojovém kódu (OpenSource) a nezávislé na operačním systému. Proto jsou psány především v Javě a zdrojové kódy jsou umístěny na SourceForge (balík selfml). Datový formát (SELFML) je XML. Další informace lze najít na stránce CML = Chemical Markup Language.

Balík selfml potřebuje několik JAR souborů. Protože jsou to binární soubory, jsou jejich verze získané z CVS nepoužitelné. Zde si můžete stáhnout funkční verze JAR souborů.

Pro vytváření datových souborů SELFML slouží EDIP (Electronic Data Input Program). Vyzkoušejte si jeho první vývojovou verzi. Stránka obsahuje i návod k použití.

SELFML vyžaduje CAS Registry Numbers. Tyto údaje jsou též v XML souboru. Na SourceForge je zdrojový kód příkladu, který umožňuje vložení seznamu sloučenin do databáze MySQL. Zde si můžete vyzkoušet prohledávací systém.

13. června 2003 jsem měl přednášku na téma: "Chemická informatika - budoucnost publikování experimentálních dat". Prezentace ve formátu PDF je k dispozici zde. Soubor se otevře automaticky v prezentačním režimu. Proto jej neprohlížejte přímo přes internet, ale raději si uložte celý soubor na svůj disk.

Friday, 09-Sep-2005 10:19:16 CEST