CAS-nummer extractor

Denne WebApp kan trække CAS-numre ud af tekst-strenge eller pdf-filer.
Den køres lokalt på udvikler-maskine - dvs. direkte i Visusal Studio.
Formålet med at udtrække cas-numre er, at man kan sammenholde cas-numre i SDS'er med cas-numre i diverse myndighedslister.
Desuden kan man også i Dansk kemidatabase lave fritekstsøgning på cas-numre.

Myndighedslister

I DanskKemidatabase er der en table der hedder "RegulationLists"
Tabellen har to felter.

- int ListId
- int CasNo

Begge felter er nøgler/index.
ListId er pt 1, 2, 4, 8 og 16 svarende til tre lister. Kræftlisten, LOUS, Kandidatlisten, Voclisten, Hormonforstyrrende.
Lige laves der udtræk fra listerne ved at copy/paste fra listerne til et tekstfelt.
Det gøres fra http://internet.danskkemidatabase.dk

Et udestående er, at en række kemikalier ikke er angivet med cas-nummer i kræftlisten.
Det gælder f.eks. Chrom-salte.
Her bør vi lave vores eget tillæg til kræftlisten, så disse kan kopieres ind sammen med kræftlisten.
Hvis ikke man gør det, vil man aldrig finde f.eks. ZinkChromat som værende på kræftlisten.

Leverandørenes SDS'er

På principielt samme måde laver vi et periodisk udtræk af cas-numre fra alle SDS'er.
I DanskKemidatabase findes der en tabel der hedder "Product_Components_CasRobot"

Tabellen har to felter.

- int ComponentId
- int CasNo

Bemærk at der extraheres på componenter - da det jo er her sds-pdf-filerne er vedhæftet.
Er der kun én komponent ligger sds-pdf-filen her.

Vi har en udfordring med, at ikke alle pdf-sds-filer kan maskinlæses.
Det kan være fordi pdf-filen er scannet og derfor ikke læsbar.
Det kan dog også være forskellige former for læsebeskyttelse på filen.

Dette kan forbedres ved, at det gøres muligt, at indskrive cas-numre til et produkt manuel.

Cas-numre tilknyttet til en komponet, findes så som en blanding af maskinlæsning og manuel indskrivning.

Det er muligt at finde komponeter der IKKE kan læses. Disse står med et CasNo=-1 i tabellen der hedder "Product_Components_CasRobot"

Vores kemiker

Vores kemiker kunne sikkert have glæde af at systemet kunne identificere hvilke liste cas-numre fra en SDS står på.

Ved et klik kunne alle myndighedslister hvor cas-nummeret forkommer blive oplistet.

Strengt taget kunne det også være en nyttig funktion for kunderne.

I dette produkt forekommer der cas-numre som står på en eller flere af disse lister.

Bedre ville det være at skrive.
I den vedhæftede SDS til dette produkt står disse cas-numre på følgende lister:

Kræftlisten:
50-00-0

Lous:
50-00-0

Og allerbedst vil det jo være at kemikalienavnet og blev listet.
Vi har dog pt. ingen sammenhæng mellem casnumre og kemikalie-navne.