« Die Geburtsurkunden für chemische Stoffe »
Für die chemische Forschung und insbesondere für die Entwicklung neuer chemischer Produkte sind detaillierte Kenntnisse über die Eigenschaften der eingesetzten Ausgangs- und Hilfsstoffe unabdingbare Voraussetzungen. Bei den dafür notwendigen Recherchen in der Literatur, in Patentschriften oder in Datenbanken begegnet man neben den obligaten Stoffdaten fast immer auch den sogenannten „CAS-Nummern“. Wie sie zustande kommen und welche Bedeutung sie haben, soll im Folgenden erläutert werden.
Derzeit sind nach neuesten Angaben der American Chemical Society (ACS) mehr als 140 Millionen chemisch definierte Stoffe bekannt und täglich werden es mehr. Sie werden vorwiegend in Fachjournalen und Patentschriften publiziert und zunehmend in Datenbanken erfasst, die als Informationstools verfügbar sind. Allerdings sind viele Datenbanken fachorientiert und daher nicht vollständig.
Ein Beispiel dafür ist die zwar sehr umfangreiche GESTIS-Datenbank der Deutschen Gesetzlichen Krankenversicherung, sie berücksichtigt jedoch vorwiegend nur die Stoffe, die im weitesten Sinne für das allgemeine Unfallgeschehen relevant sind.
So referiert GESTIS zwar Reinst-Wasser (H2O), nicht aber die beiden isoptopen Analoga, das sogenannte „Schwere Wasser“ Deuteriumdioxid (D2O) und das radioaktive Tritiumdioxid (T2O).
Der Chemical Abstracts Service (CAS)
Die größte und vollständigste Recherche-Datenbank stellt der US-amerikanische Chemical Abstract Service (CAS) mit Sitz in Columbus, Ohio zur Verfügung. Die CAS-Datenbank besteht seit 1965 und ist als klassische Referenzdatenbank für Literaturrecherchen aufgebaut.
Dieser Service wird von der weltgrößten Chemie-Fachorganisation, der American Chemical Society (ACS), bereit gestellt, die die weltweite, wissenschaftliche Fachliteratur auswertet und alle stofflichen Neuheiten registriert.
Die CAS-Datenbank bietet neben der englischen Zusammenfassung der gesammelten Fachartikel den direkten Verweis auf die Originalquellen. Sie enthält zudem die nahezu vollständige wissenschaftliche Fachliteratur zu Themen aus den Bereichen Chemie, Biochemie, Kunststofftechnologie und Materialwissenschaften seit 1907.
Die CAS-Nummer
Die CAS-Nummer (engl.: Chemical Abstract Service Registry Number) ist die Registriernummer für jeden einzelnen Stoffeintrag in die Datenbank des Chemical Abstract Service und liefert damit eine eindeutige, numerische Kennung für den jeweiligen chemischen Stoff. Sie wird fortlaufend vergeben und hat somit keinen direkten Bezug zum referenzierten Stoff selbst oder zu sonstigen relevanten Kenndaten. Die CAS-Nummer ist damit eine „Geburtsurkunde“ für jeden bekannt gewordenen Stoff.
Aufgebaut ist die CAS-Nummer als dreigliedrige Zahlenfolge aus bis zu 10 Ziffern im Format 9 8 7 6 5 4 3 – 2 1 – 0. Hierbei bezeichnen die beiden ersten Blöcke den Eintrag in der CAS-Datenbank. Sie sind die formale Registriernummer. Die letzte Ziffer ist eine Prüfzahl für die Plausibilität des Datenbank-Eintrags. Sie entspricht der letzten Ziffer der gewichteten Summe aller vorhergehenden Ziffern der CAS-Registrierummer und wird nach
ermittelt. So ergibt sich beispielsweise für den Massenkunststoff Polypropylen (PP) mit der CAS-Registriernummer 9003-07 gemäß der Rechenvorschrift die Prüfsumme R (von rechts nach links) wie folgt:
R = (1 x 7) + (2 x 0) + (3 x 3) + (4 x 0) + (5 x 0) + (6 x 9) = 70
Aus der Prüfsumme R = 70 ergibt sich die Prüfzahl 0 (Null). Die vollständige CAS-Nummer für Polypropylen (PP) ist demnach 9003-07-0.
Die CAS-Datenbank in der Praxis
Über die CAS-Datenbank sind Stoffinformationen zu praktisch allen bis dato bekannten chemischen Stoffen zugänglich, zu denen Mineralien, Polymere und Legierungen, aber auch Proteine und DNA-Sequenzen zählen. Sie enthält auch alle bekannt gewordenen Informationen zu den die chemischen Elementen, die über ihre CAS-Nummern eindeutig dokumentiert sind, wie beispielsweise für Sauerstoff (CAS-Nummer 7782-44-7), Chlor (CAS-Nummer 7782-50-5), Blei (CAS-Nummer 7439-92-1) oder auch für das radioaktive Plutonium (CAS-Nummer 7440-07-5).
Selbst erst in jüngster Zeit erzeugte, künstliche Elemente haben längst Eingang in die CAS-Datenbank gefunden. So ist das im Jahre 2010 erstmalig dargestellte Element mit der Ordnungszahl 117 und dem Namen „Tennesine“ (Ts), ein Halogen, mit der CAS-Nummer 87658-56-8 in die CAS-Datenbank eingetragen worden.
Ebenso ist das synthetische chemische Element mit der höchsten bislang erreichten Ordnungszahl 118, das künstliche Element „Oganesson“ (Og), mit der CAS-Nummer 54144-19-3 bereits registriert. Die gelungene Darstellung dieses, zu den Edelgasen zählenden Elements im Jahre 2006 war wegen Fehler in der ersten Publikation lange umstritten. Erst nach Prüfung und Bestätigung durch die „International Union of Pure and Applied Chemistry“ (IUPAC) im Jahre 2015 wurde auch das Element 118 in die CAS-Datenbank aufgenommen.
Die CAS Registry Datenbank berücksichtigt im Gegensatz zu vielen anderen Informationstools schließlich auch die isotope Analoga von Verbindungen, wie am bereits erwähnten Beispiel „Wasser“ gezeigt werden soll:
Reines Wasser H2O hat die CAS-Nummer 7732-18-5, das sogenannte „schwere“ Wasser“ D2O, bei dem der Wasserstoff gegen sein schwereres Isotop Deuterium (D) ausgetauscht ist, wird hingegen unter der CAS-Nummer 7789-20-0 geführt. Das aus dem schwersten der drei Wasserstoffisotope, dem radioaktiven Tritium (T) gebildete Wasser T2O hat schließlich die CAS-Nummer 1494-65-9.
Die CAS-Registry Datenbank wird täglich aktualisiert und ist daher weltweit die umfassendste Informationsquelle für Chemiker aller Fachrichtungen, Produktentwickler, Techniker und Unternehmensführer. Der Zugang zu der Datenbank ist mit Hilfe der Software-Lösung SciFinder® über die Website des Chemical Abstracts Service möglich. Diese erlaubt über die CAS-Nummer den unmittelbaren Zugriff zu den jeweils relevanten Stoffinformationen und Referenzen.
Der Zugang zur CAS-Registry-Datenbank ist allerdings nur für registrierte Benutzer möglich und der Zugriff auf die referenzierten Literaturquellen ist kostenpflichtig, was aber durch den Umfang der gebotenen Leistungen durchaus gerechtfertigt ist.
Die Aussichten
Die Zahl neuer Stoffe scheint immer noch ungebremst zuzunehmen. Waren zu Ende der 1960er Jahre nur etwas mehr als eine Million Stoffe bekannt und registriert, waren es zehn Jahre später schon 5 Millionen und zu Beginn des 21. Jahrhunderts bereits mehr als 20 Millionen Stoffe. Heute sind über 140 Millionen Stoffe in der CAS-Registry Datenbank registriert und ein Ende ist nicht abzusehen.
Ein Grund dafür dürfte sein, dass seit Mitte der 1990er Jahre auch genbiologisch relevante Stoffe, wie DNA-Sequenzen und Eiweißstoffe, Eingang in die Datenbank gefunden haben und den Großteil der „neuen“ Substanzen ausmachen. Dennoch werden auch weiterhin zahlreiche Entwicklungen auf den klassischen Arbeits- und Forschungsgebieten der Chemie, wie dem Pharma- und Medizinbereich, der Kunststoffindustrie sowie der Landwirtschafts- und Lebensmitteindustrie zu neuen Produkten führen, die auch künftig in die CAS-Datenbank eingehen.
Dabei ist unerheblich, ob sie eine sinnvolle Verwendung gefunden haben oder nicht. In der CAS-Registry-Datenbank wird alles Neue registriert, selbst wenn manche Einträge für den Moment noch absurd erscheinen mögen, wie die für die künstlichen Elemente. So geht jedoch einmal erlangtes Wissen nicht mehr verloren.