CHEM-ŁEB

MAGAZYN ODCZYNNIKÓW Z MOŻLIWOŚCIĄ SZUKANIA STRUKTUR CHEMICZNYCH


Jako chemik organik, który kupuje i syntetyzuje dużo substancji chemicznych (i nie dysponuje super-pamięcią) po pewnym czasie miałem problem z odnalezieniem się w natłoku substancji, które gdzieś tam zalegają w szafkach i lodówkach. Być może czytający te słowa chemicy organicy znają internetowe chemiczne bazy danych typu Emolecules czy Chemexper, które umożliwiają wyszukiwanie dostawców substancji chemicznych na podstawie zadanej struktury lub jej fragmentu oraz bazy typu Scifinder czy Reaxys, które na podstawie wzoru strukturalnego umożliwoją odnalezienie informacji o syntezie cząsteczki. Zawsze zastanawiało mnie dlaczego uczelniane wydziały chemiczne w porozumieniu z informatycznymi nie stworzą takiego narzędzia na własny użytek. Najwyraźniej nikt nie dostrzega takiej potrzeby. Ponadto, żeby przedsięwzięcie miało sens, ktoś musi stale nad taką baza czuwać, żeby była zawsze aktualna i ten fakt może być trudniejszy do spełnienia niż samo stworzenie bazy, gdyż dbanie o aktualność wpisów wymaga systematyczności i cierpliwości, oraz współpracy ponad podziałami, co w warunkach uczelni nie zawsze jest proste. Nie wiem jak sytuacja wygląda w firmach, ale wydaje się, że takim rozwiązaniem powinny być zainteresowane szczególnie te, które mają ambicje prowadzić badania nad nowymi lekami, gdyż produkują setki struktur, które warto byłoby jakoś katalogować i wyszukiwać. Ja uznałem, że dobrze byłoby mieć taką bazę danych dla siebie i spróbowałem stworzyć ją od podstaw.

Co chciałem osiągnąć:

Co było potrzebne:

Połączenie w całość wszystkich wymienionych komponentów nie było proste, ale udało się. Uzyskałem bazę danych, która z powodzeniem sprawdza się w mojej firmie. Jej wersja demonstracyjna jest do obejrzenia pod adresem:
http://193.239.206.10:880/baza-demo/search.rvt?dbname=baza-demo
Od razu zaznaczam, że pewne komponenty jak logowanie użytkowników, edycja i dodawanie wpisów, eksport do pliku SDF, dane analityczne, historia użytkowania odczynników zostały wyłączone. Działa za to możliwośc wyszukiwania substancji w bazach Emolecules i Chemexper (w oknie edycji wpisu). Baza zawiera ponad 4 tysiące struktur. Serwer użyty do celów demonstracyjnych jest starożytny (Pentium III) i dość powolny, ale mimo to swoją rolę spełnia w miarę dobrze. Zachęcam do testowania. Bazę można przeszukiwać klasycznie, czyli po nazwie, masie molowej i innych polach w niej obecnych oraz - co najważniejsze - wyszukiwać fragmenty struktur. Tu mała uwaga: im bardziej złożona struktura w zapytaniu - tym wyszukiwanie cząsteczek, które ją zawierają jest szybsze. Np. wyszukiwanie zapytania o struktury zawierające po prostu wiązanie pojedyńcze czy sam niepodstawiony pierścień benzenowy trwa dosyć długo (ok. 10s - słaby serwer), ale już np. chlorobenzen czy piperydyna zajmuje czas ok 1s.

Ponieważ użyłem komponentów wydanych na licencji GNU GENERAL PUBLIC LICENSE. Udostępniam kod źródłowy bazy danych.


AUTOR ZAPRASZA NA SWOJE STRONY WWW