Bekannte Clusterindices werden erstmals mit biologischen Distanzmaßen kombiniert und sofern nötig dafür erweitert. Die entwickelten Indices erlauben eine biologische Evaluation von Gengruppen, wie z.B. Genexpressionsclustern oder Clustern von Gensequenzen, um die Cluster herauszufinden, die biologisch interessant sind. Die dazu benötigten biologischen Distanzmaße für Gene werden mithilfe von Gene Ontology Annotationen berechnet, die in den meisten öffentlichen Datenbanken verfügbar sind. Die Gene Ontology (GO) ist eine Taxonomie, die fachspezifisches, biologisches Wissen in einer für Computer prozessierbaren Form zur Verfügung stellt.
Das Clustering mit GO-basierten Distanzen stellt an den verwendeten Clusteralgorithmus andere Ansprüche als ein rein numerischer Datensatz, da z.B. GO-basierte Mittelwerte zwischen Genen nicht berechnet werden können. Viele konventionelle Clusteralgorithmen werden vor diesem Hintergrund unbrauchbar. In der vorliegenden Dissertation wurde daher ein neues, auf einem Evolutionären Algorithmus basierendes, Clusterverfahren (MST-MA) entwickelt. Der Einfluss der verschiedenen Parameter des MST-MA auf die Qualität der gefundenen Lösungen wird untersucht, und der MST-MA wird mit anderen für das Problem geeigneten Clusterverfahren verglichen.
Des Weiteren sind bei der Arbeit mit den vorhandenen biologischen Distanzfunktionen für Gene einige gravierende Mängel dieser Unähnlichkeitsmaße deutlich geworden. Daher wurden vier neue Ähnlichkeitsfunktionen entwickelt, bei denen diese Nachteile nicht mehr bestehen. Wir untersuchen und vergleichen die vier verschiedenen Ähnlichkeitsmaße ausführlich und testen sie in Verbindung mit Spektralclustering, dualem K-Means und Average Linkage Clustering. Die gewählte Repräsentation als Empirical Kernel Map ermöglicht, dass nun auch GO-basierte Mittelwerte zwischen den Genen berechnet werden können. Bei allen Ähnlichkeitsmaßen handelt es sich um Kernelfunktionen, was sie auch für andere Verfahren, wie z.B. Support Vektor Maschinen, interessant macht. Grundsätzlich sind die vorgestellten Ähnlichkeitsfunktionen jedoch offen für jede Art von maschinellem Lernenverfahren, das funktionale Ähnlichkeiten verwenden soll.
KAUFOPTIONEN
40.50 € | ||
auf Lager | ||
Versandkostenfrei innerhalb Deutschlands |
Wollen auch Sie Ihre Dissertation veröffentlichen?