53
Medizinische Statistik Medizinische Statistik und und Informationsverarbeitung Informationsverarbeitung Quade Quade Institut für Medizinische Statistik, Institut für Medizinische Statistik, Dokumentation und Datenverarbeitung Dokumentation und Datenverarbeitung Quade Quade

Medizinische Statistik und Informationsverarbeitung Quade Institut für Medizinische Statistik, Dokumentation und Datenverarbeitung

Embed Size (px)

Citation preview

Page 1: Medizinische Statistik und Informationsverarbeitung Quade Institut für Medizinische Statistik, Dokumentation und Datenverarbeitung

Medizinische Statistik und Medizinische Statistik und InformationsverarbeitungInformationsverarbeitung

QuadeQuade

Institut für Medizinische Statistik, Institut für Medizinische Statistik, Dokumentation und DatenverarbeitungDokumentation und Datenverarbeitung

QuadeQuade

Page 2: Medizinische Statistik und Informationsverarbeitung Quade Institut für Medizinische Statistik, Dokumentation und Datenverarbeitung

NetzwerkeNetzwerke

QuadeQuade

Netzwerke verbinden Computer Netzwerke verbinden Computer

untereinander.untereinander.

Vereinbarungen für den Vereinbarungen für den

Informationstransport und Informationstransport und

-Austausch nennt man Protokolle. Netzwerke -Austausch nennt man Protokolle. Netzwerke

werden nach dem OSI Referenzmodell in 7 werden nach dem OSI Referenzmodell in 7

Schichten eingeteilt. Dabei nimmt die Schichten eingeteilt. Dabei nimmt die

unterste Schicht großen Einfluß auf die unterste Schicht großen Einfluß auf die

Leistungsdaten eines Netzwerkes.Leistungsdaten eines Netzwerkes.

Page 3: Medizinische Statistik und Informationsverarbeitung Quade Institut für Medizinische Statistik, Dokumentation und Datenverarbeitung
Page 4: Medizinische Statistik und Informationsverarbeitung Quade Institut für Medizinische Statistik, Dokumentation und Datenverarbeitung

QuadeQuade

Page 5: Medizinische Statistik und Informationsverarbeitung Quade Institut für Medizinische Statistik, Dokumentation und Datenverarbeitung

Netzwerke

In einem lokalen physikalischen Netzwerk erkennen sich die Teilnehmer mittels der MAC-Adresse (Media Access Control (Schicht 2 des OSI Referenz Modells)) der Netzwerk Karte (arp –a unter Windows).

Die Abbildung in die uns bekannte IP-Adresse geschieht mittels des Adress Resolution Protokolls (ARP)

Page 6: Medizinische Statistik und Informationsverarbeitung Quade Institut für Medizinische Statistik, Dokumentation und Datenverarbeitung

IP-Netzwerkadressen

Eine IP-Adresse besteht aus 4 Zahlen zwischen 0 und 255. Die Netzwerkmaske (z.B. 255.255.x.x) bestimmt den Netzwerkteil und den Knotenteil. Die höchste und die niedrigste Knotenadresse ist jeweils für Broadcasts reserviert. Alle Rechner im Netzwerk lauschen auf den Broadcast-Adressen.

Page 7: Medizinische Statistik und Informationsverarbeitung Quade Institut für Medizinische Statistik, Dokumentation und Datenverarbeitung

IP-Netzwerke

Ip-Netz 131.220.23.0 Broadcast 0 & 255

Maske 255.255.255.0 oder /24

131.220. 23 . 0

IP-Binär131.220. 0001 0111 . 0000 0000

Maske 255.255. 1111 1111 . 0000 0000

255.255. 255 . 0

Daher können sich Rechner mit den IP-Adressen 131.220.23.1 bis 131.220.23.254 in einem lokalen Netzwerk „sehen“.

Page 8: Medizinische Statistik und Informationsverarbeitung Quade Institut für Medizinische Statistik, Dokumentation und Datenverarbeitung

Befehle um die Netzwerkkonfiguration zu sehen

ipconfig

Windows-IP-Konfiguration

Ethernetadapter Drahtlose Netzwerkverbindung:

Medienstatus. . . . . . . . . . . : Es besteht keine Verbindung

Ethernetadapter LAN-Verbindung:

Verbindungsspezifisches DNS-Suffix: meb.uni-bonn.de

IP-Adresse. . . . . . . . . . . . : 172.30.1.70

Subnetzmaske. . . . . . . . . . . : 255.255.255.0

Standardgateway . . . . . . . . . : 172.30.1.254

Page 9: Medizinische Statistik und Informationsverarbeitung Quade Institut für Medizinische Statistik, Dokumentation und Datenverarbeitung

Befehle um die Netzwerkkonfiguration zu sehen

netstat -a

Aktive Verbindungen

Proto Lokale Adresse Remoteadresse Status

TCP Quade-T60:epmap Quade-T60:0 ABHÖREN

TCP Quade-T60:microsoft-ds Quade-T60:0 ABHÖREN

TCP Quade-T60:2869 Quade-T60:0 ABHÖREN

TCP Quade-T60:5800 Quade-T60:0 ABHÖREN

TCP Quade-T60:5900 Quade-T60:0 ABHÖREN

TCP Quade-T60:6060 Quade-T60:0 ABHÖREN

TCP Quade-T60:10243 Quade-T60:0 ABHÖREN

TCP Quade-T60:31038 Quade-T60:0 ABHÖREN

TCP Quade-T60:1036 Quade-T60:0 ABHÖREN

TCP Quade-T60:1090 localhost:27015 HERGESTELLT

TCP Quade-T60:1168 localhost:1169 HERGESTELLT

TCP Quade-T60:1169 localhost:1168 HERGESTELLT

Page 10: Medizinische Statistik und Informationsverarbeitung Quade Institut für Medizinische Statistik, Dokumentation und Datenverarbeitung

Befehle um die Netzwerkkonfiguration zu sehen

netstat -b

Aktive Verbindungen

Proto Lokale Adresse Remoteadresse Status PID

TCP Quade-T60:1090 localhost:27015 HERGESTELLT 6020 [iTunesHelper.exe]

TCP Quade-T60:3289 localhost:3290 HERGESTELLT 6108 [Netscp.exe]

TCP Quade-T60:3290 localhost:3289 HERGESTELLT 6108 [Netscp.exe]

TCP Quade-T60:4844 localhost:4845 HERGESTELLT 5016 [firefox.exe]

TCP Quade-T60:4845 localhost:4844 HERGESTELLT 5016 [firefox.exe]

TCP Quade-T60:4847 localhost:4848 HERGESTELLT 5016 [firefox.exe]

TCP Quade-T60:4848 localhost:4847 HERGESTELLT 5016 [firefox.exe]

TCP Quade-T60:27015 localhost:1090 HERGESTELLT 712 [AppleMobileDeviceService.exe]

TCP Quade-T60:5152 localhost:1088 SCHLIESSEN_WARTEN 3004 [jqs.exe]

Page 11: Medizinische Statistik und Informationsverarbeitung Quade Institut für Medizinische Statistik, Dokumentation und Datenverarbeitung

Befehle um die Netzwerkkonfiguration zu sehen

netstat -ano

Aktive Verbindungen

Proto Lokale Adresse Remoteadresse Status PID

TCP 0.0.0.0:80 0.0.0.0:0 ABHÖREN 7128

TCP 0.0.0.0:135 0.0.0.0:0 ABHÖREN 552

TCP 0.0.0.0:445 0.0.0.0:0 ABHÖREN 4

TCP 0.0.0.0:2869 0.0.0.0:0 ABHÖREN 1076

TCP 0.0.0.0:5800 0.0.0.0:0 ABHÖREN 2808

TCP 0.0.0.0:5900 0.0.0.0:0 ABHÖREN 2808

TCP 0.0.0.0:6060 0.0.0.0:0 ABHÖREN 684

TCP 0.0.0.0:10243 0.0.0.0:0 ABHÖREN 2632

TCP 0.0.0.0:31038 0.0.0.0:0 ABHÖREN 2024

TCP 127.0.0.1:1036 0.0.0.0:0 ABHÖREN 1912

Page 12: Medizinische Statistik und Informationsverarbeitung Quade Institut für Medizinische Statistik, Dokumentation und Datenverarbeitung

Befehle um die Netzwerkkonfiguration zu sehen

arp -aAddress HWtype HWaddress Flags Mask iface

www.dsmrsvpaed.de ether 00:16:3e:57:90:23 C br0

www.oncopaednki.de ether 00:16:3e:57:90:23 C br0

linkdb.meb.uni-bonn.de ether 00:16:3e:35:c1:5e C br0

famhap.meb.uni-bonn.de ether 00:16:3e:35:c1:5e C br0

www-dom0.meb.uni-bonn.d ether 00:15:17:ab:ae:fe C br0

nmap 131.220.23.0/24Interesting ports on Jumbo-dom0.meb.uni-bonn.de (131.220.23.181):

Not shown: 998 closed ports

PORT STATE SERVICE

22/tcp open ssh

111/tcp open rpcbind

MAC Address: 00:30:48:20:0C:D4 (Supermicro Computer)

Page 13: Medizinische Statistik und Informationsverarbeitung Quade Institut für Medizinische Statistik, Dokumentation und Datenverarbeitung

IP-Netzwerkklassen

Eine IP-Adresse ist zweigeteilt und zwar in einen Netzwerkteil und einen Knotenteil. Der Netzwerkteil ist innerhalb eines Netzwerksegments überall gleich, während jeder Rechner oder jedes andere Gerät seine eigene Knotennummer bekommt.

10.10.10.10 Maske 255.0.0.0

Page 14: Medizinische Statistik und Informationsverarbeitung Quade Institut für Medizinische Statistik, Dokumentation und Datenverarbeitung

IP-Netzwerkklassen

Über die Netzwerknummer erfolgt auch die Einteilung in sogenannte Netzwerk-Klassen in A-, B- oder C-Klasse Netzwerke. Das Prinzip ist, dass große Netzwerke mit vielen Knoten möglichst eine Klasse A oder wenigstens eine Klasse B Nummer bekommen und kleine Netze eine Klasse C Nummer

http://www.instrumentation.de/5106003d.htm

Page 15: Medizinische Statistik und Informationsverarbeitung Quade Institut für Medizinische Statistik, Dokumentation und Datenverarbeitung

IP-Netzwerkklassen

Klasse A (1.0.0.0 bis 127.255.255.255): • Das erste Bit der Adresse ist auf Null gesetzt. Die

ersten acht Bit identifizieren das Netzwerk, die restlichen 24 Bit den Host. Insgesamt sind 127 Class-A-Netze möglich.

• Reserviert: 127.x.x.x (loopback/localhost)• Privat: 10.0.0.0 - 10.255.255.255• Maske: 255.0.0.0 oder /8

Page 16: Medizinische Statistik und Informationsverarbeitung Quade Institut für Medizinische Statistik, Dokumentation und Datenverarbeitung

IP-Netzwerkklassen

Das Klasse B (128.0.0.0 bis 191.255.255.255): • Bei Klasse-B-Netzen ist das erste Bit auf Null, das

zweite Bit auf eins gesetzt. Die ersten 16 Bit beschreiben das Netzwerk, die anderen 16 Bit sind die Hostadresse.

• Netze: 16.384 mit maximal 65.534 angeschlossenen Computern.

• Privat: 172.16.0.0 - 172.31.255.255• Maske 255.255.0.0 oder /16

Page 17: Medizinische Statistik und Informationsverarbeitung Quade Institut für Medizinische Statistik, Dokumentation und Datenverarbeitung

IP-Netzwerkklassen

Klasse C (192.0.0.0 bis 223.255.255.255) : • Diese Netzwerkart erlaubt nur 255 Hosts in einem Netz. Die

ersten drei Bit einer Class-C-Adresse bilden dabei die Folge "110". Die ersten 24 Bit identifizieren das Netzwerk, nur acht Bit den Host.

• 2.097.152 Netze mit jeweils 254 Rechnern • Privat: 192.168.0.0 - 192.168.255.255• Mask 255.255.255.0 oder /24

Page 18: Medizinische Statistik und Informationsverarbeitung Quade Institut für Medizinische Statistik, Dokumentation und Datenverarbeitung

IP-Netzwerkklassen

Klasse D: 224.0.0.0 - 239.255.255.255 für spezielle Dienste z.B. Multicast

Page 19: Medizinische Statistik und Informationsverarbeitung Quade Institut für Medizinische Statistik, Dokumentation und Datenverarbeitung

Ports

• Jede IP-Adresse hat 65536 Ports• festgelegte privilegierte Ports 0 bis 1023.• festgelegte Ports von 1024 bis 49151• dynamische oder private von 49152 bis

65535http://www.iana.org/assignments/port-numbers

Page 20: Medizinische Statistik und Informationsverarbeitung Quade Institut für Medizinische Statistik, Dokumentation und Datenverarbeitung

Firewall

• Die Firewall legt fest, ob eine Verbindung erlaubt ist.

• Die Firewall kontrolliert eingehende, weitergeleitete und ausgehende Pakete.

• Die Firewall kann berücksichtigen, ob Pakete zu einer bereits bestehenden Verbindung gehören.

Page 21: Medizinische Statistik und Informationsverarbeitung Quade Institut für Medizinische Statistik, Dokumentation und Datenverarbeitung

Firewall

• iptables -A INPUT -i eth0 -p ICMP -j ACCEPT • iptables -A OUTPUT -o eth0 -p ICMP -j DROP

Page 22: Medizinische Statistik und Informationsverarbeitung Quade Institut für Medizinische Statistik, Dokumentation und Datenverarbeitung

Router

Ein router leitet Pakete aktiv von einem Netzwerk in ein anderes. Dabei können die Pakete (z.B. IP-Adresse) auch verändert werden.

Page 23: Medizinische Statistik und Informationsverarbeitung Quade Institut für Medizinische Statistik, Dokumentation und Datenverarbeitung

Switch

Ein switch verbindet Netzwerksegmente oder Rechner miteinander. Dabei können auch mehrere Rechner in virtuellen Netzwerken (vlan) zusammengefasst werden.

Page 24: Medizinische Statistik und Informationsverarbeitung Quade Institut für Medizinische Statistik, Dokumentation und Datenverarbeitung

Historie

• Einzelne Inseln

• Jeder vertaut Jedem (frühes Internet)

Company ACompany B

Company C

Internet

Company BCompany A

RouterRouter

Page 25: Medizinische Statistik und Informationsverarbeitung Quade Institut für Medizinische Statistik, Dokumentation und Datenverarbeitung

Weitere Entwicklung• Filtern & Firewalls

• demilitarisierte Zonen

Internet

Company A

FirewallRouter

Internet

FirewallRouter

Company ADMZ

Company AInternalNetwork

WWW Server DNS Server SMTP Relay

Page 26: Medizinische Statistik und Informationsverarbeitung Quade Institut für Medizinische Statistik, Dokumentation und Datenverarbeitung

Sichere Architektur • Virtuelle Gemeinschaft (Extranets & B2B VPNs)

– Site-to-site VPN tunnel

– Vernetzung mit Praxen

Internet

FirewallRouter

Company BDMZ

Company BInternalNetwork

Company BExtranet

RouterFirewall

Company ADMZ

Company AExtranet

Company AInternalNetwork

Page 27: Medizinische Statistik und Informationsverarbeitung Quade Institut für Medizinische Statistik, Dokumentation und Datenverarbeitung

und weiter …• Virtuell mobile Arbeitsweise (C2B VPNs)

– Zunehmend schneller Internetzugang

– Firewalls mit VPN-Funktionalität

– Dedizierte VPN-Konzentratoren machen den Zugang für mobile Arbeitsplätze von der Firewall unabhängig

Firewallw/ Tunnel

Internet

Router

Company ADMZ

Company AInternalNetwork

Mobiler Arbeitsplatz

Telearbeit

Page 28: Medizinische Statistik und Informationsverarbeitung Quade Institut für Medizinische Statistik, Dokumentation und Datenverarbeitung

BegriffeBegriffe

QuadeQuade

html:html: Hypertext Markup Hypertext Markup

LanguageLanguage

http:http: Hypertext Transfer Hypertext Transfer

ProtocolProtocol

Page 29: Medizinische Statistik und Informationsverarbeitung Quade Institut für Medizinische Statistik, Dokumentation und Datenverarbeitung

QuadeQuade

HTML Bearbeitung

Page 30: Medizinische Statistik und Informationsverarbeitung Quade Institut für Medizinische Statistik, Dokumentation und Datenverarbeitung

QuadeQuade

Logfiles & Cookies

LogFormat "%h %l %u %t \"%r\" %s %b %T %{Cookie}n \

\"%{Referer}i\" \"%{User-Agent}i\" \"%{UNIQUE_ID}e\""

Page 31: Medizinische Statistik und Informationsverarbeitung Quade Institut für Medizinische Statistik, Dokumentation und Datenverarbeitung

AAA+BA+B

AAA+CA+C

RecallRecall Anteil der gefundenen Daten an Anteil der gefundenen Daten an den gesuchten Datenden gesuchten Daten

Precision Precision Anteil der gefundenen Daten Anteil der gefundenen Daten der von Interesse istder von Interesse ist

Ergebnis Ergebnis der Sucheder Suche

vorhandene Datenvorhandene Datenrelevant relevant irrelevantirrelevant

gefundengefunden

nicht gefundennicht gefunden

AA BB

CC DD

Recherchesysteme

Page 32: Medizinische Statistik und Informationsverarbeitung Quade Institut für Medizinische Statistik, Dokumentation und Datenverarbeitung

RecherchesystemeRecherchesysteme

QuadeQuade

MEDLINEMEDLINE Schlagworte, Autoren (3000 Schlagworte, Autoren (3000 journals) journals)

http://www.ncbi.nlm.nih.gov/PubMed/http://www.ncbi.nlm.nih.gov/PubMed/

CURRENTCURRENT wöchentlich erstelltes lnhaltsverzeichnis wöchentlich erstelltes lnhaltsverzeichnis CONTENTS CONTENTS wichtiger Journals wichtiger Journals

SCIENCE SCIENCE wie häufig wurde eine Publikation zitiertwie häufig wurde eine Publikation zitiertCITATION INDEXCITATION INDEX

Page 33: Medizinische Statistik und Informationsverarbeitung Quade Institut für Medizinische Statistik, Dokumentation und Datenverarbeitung

Funktion von Xindex mit UMLS-Metathesaurus

Wortliste

UMLS-Metathesaurus

DokumentPrimäre Wortliste

(Konzepte)

RankingRank = Wörter pro Begriff * Anzahl * 1/Doclen * 1/Anz. Häufigster Begriff

Index für das Dokument mit Preffered Terms

Page 34: Medizinische Statistik und Informationsverarbeitung Quade Institut für Medizinische Statistik, Dokumentation und Datenverarbeitung

Vorteile von Xindex gegenüber dem StandardErkennen von Wortkombinationen

z.B. Breast Cancer

Gleiches Suchergebnis bei unterschielicher Schreibweise

z.B. hpv und HPV

z.B. MTX und Methotrexat

Sinnvolles Suchergebnis bei trivialen Begriffen

z.B. love --> HPV, Cervixcarzinom, Brustkrebs

Es werden Dokumente in verschiedenen Sprachen gefunden

z.B. Englisch, Deutsch und Spanisch

Page 35: Medizinische Statistik und Informationsverarbeitung Quade Institut für Medizinische Statistik, Dokumentation und Datenverarbeitung

Vorteile von Xindex gegenüber WAIS

Beispiel Melanom

Page 36: Medizinische Statistik und Informationsverarbeitung Quade Institut für Medizinische Statistik, Dokumentation und Datenverarbeitung

Vorteile von Xindex

Es werden seltene Entitäten gefunden:

Suche nach „Melanom“

liefert Informationen zum „Wilms Tumor“

Dieser steht in Verbindung zum „clearcellsarcoma“

einer seltenen Form des Melanoms

Erkennen von Synonymen

z.B. Mumps, Parotitis epidemica

Page 37: Medizinische Statistik und Informationsverarbeitung Quade Institut für Medizinische Statistik, Dokumentation und Datenverarbeitung

Der UMLS-Metathesaurus

Integration vorhandener Thesaurie:

ICD 10, MESH, Cancerlit, HL7-Zusatz

Mehrsprachig: z.B. Englisch, Deutsch, Spanisch, Russisch,Französisch, Finnisch, Italienisch, ...

Konzeptorientierung:

Jedes Konzept bekommt eine Nummer (CUI)

Jedes Synonym jedes Konzeptes bekommt eine eigene Nummerin verschiedenen Sprachen sowohl normalisiert (SUI) als auch nicht normalisiert (LUI) Kennzeichnung des „Preffered Terms“

Page 38: Medizinische Statistik und Informationsverarbeitung Quade Institut für Medizinische Statistik, Dokumentation und Datenverarbeitung

NutzerproblemeNutzerprobleme

• Wie finde ich als Laie eine Information? Wie finde ich als Laie eine Information?

• Wie kann ich die Seriosität einer Wie kann ich die Seriosität einer Information erkennen (weit mehr fragliche Information erkennen (weit mehr fragliche Informationen denn gute) ?Informationen denn gute) ?

• Wie finde ich beim Anbieter eine Wie finde ich beim Anbieter eine Information trotz bildorientierter Information trotz bildorientierter Oberfläche?Oberfläche?

Page 39: Medizinische Statistik und Informationsverarbeitung Quade Institut für Medizinische Statistik, Dokumentation und Datenverarbeitung

Was man wissen sollte!Was man wissen sollte!

• Suchmaschinen lesen über „Spider“ Dokumente Suchmaschinen lesen über „Spider“ Dokumente ein und erstellen einen Volltext-Index (nicht bei ein und erstellen einen Volltext-Index (nicht bei Datenbanken, Graphiken, Java).Datenbanken, Graphiken, Java).

• Metatags werden nur bedingt ausgewertet. Metatags werden nur bedingt ausgewertet. (Anbieter manipulieren „auf Teufel komm raus“)(Anbieter manipulieren „auf Teufel komm raus“)

• Ranking ist nicht intelligent und bevorzugt kurze Ranking ist nicht intelligent und bevorzugt kurze Dokumente.Dokumente.

• Für Geld wird das Ranking manipuliert!Für Geld wird das Ranking manipuliert!

Page 40: Medizinische Statistik und Informationsverarbeitung Quade Institut für Medizinische Statistik, Dokumentation und Datenverarbeitung

Meta-TagsMeta-Tags

<META NAME="keywords"<META NAME="keywords" CONTENT="CONTENT="Breast cancer, oncology, Cancer, medicine, Breast cancer, oncology, Cancer, medicine,

Medizin, Krebs, CancerNet, PDQ, TumorMedizin, Krebs, CancerNet, PDQ, Tumor">"><META HTTP-EQUIV="RESOURCE-TYPE" content="document"><META HTTP-EQUIV="RESOURCE-TYPE" content="document"><META name="description" content="Breast cancer"><META name="description" content="Breast cancer">

Page 41: Medizinische Statistik und Informationsverarbeitung Quade Institut für Medizinische Statistik, Dokumentation und Datenverarbeitung

QualitätssiegelQualitätssiegel

• Geschütztes Logo einer anerkannten Organisation Geschütztes Logo einer anerkannten Organisation (NCI)(NCI)

• HON Code of ConductHON Code of Conduct• Link von einer anerkannten Organisation (WHO)Link von einer anerkannten Organisation (WHO)• MedCERTAINMedCERTAIN

Page 42: Medizinische Statistik und Informationsverarbeitung Quade Institut für Medizinische Statistik, Dokumentation und Datenverarbeitung

Evaluation kommerzieller AnbieterEvaluation kommerzieller Anbieter

• Kriterien für Focus RechercheKriterien für Focus Recherche– Nutzen für den UserNutzen für den User– Kostensenkung durch weniger ArztbesucheKostensenkung durch weniger Arztbesuche– Richtigkeit und AusgewogenheitRichtigkeit und Ausgewogenheit– VollständigkeitVollständigkeit– Online-Arzt vorhandenOnline-Arzt vorhanden

Page 43: Medizinische Statistik und Informationsverarbeitung Quade Institut für Medizinische Statistik, Dokumentation und Datenverarbeitung

• Ergebnis der Recherche für Focus Ergebnis der Recherche für Focus

– Der User kann einen Arzt finden. Ein Hausarzt-Buch ist auf Der User kann einen Arzt finden. Ein Hausarzt-Buch ist auf mehrere Tausend Pages aufgeteilt.mehrere Tausend Pages aufgeteilt.

– Der User verbringt viel Zeit für wenig Information im Netz. Der User verbringt viel Zeit für wenig Information im Netz. Seiten werden aus Datenbank generiert. Viele Wege führen zur Seiten werden aus Datenbank generiert. Viele Wege führen zur gleichen Seite.gleichen Seite.

– Bachblüten und Standardtherapie gleichwertig im Angebot.Bachblüten und Standardtherapie gleichwertig im Angebot.

– Nur Infos vom eigenen Server. Suche extrem schwierig Nur Infos vom eigenen Server. Suche extrem schwierig (Stunden) da Information versteckt. (Stunden) da Information versteckt.

– Online-Arzt ist nicht hilfreich für eigene Fragen (Show). Online-Arzt ist nicht hilfreich für eigene Fragen (Show).

Page 44: Medizinische Statistik und Informationsverarbeitung Quade Institut für Medizinische Statistik, Dokumentation und Datenverarbeitung

Was will der Nutzer?Was will der Nutzer?

• Informationen zu KrankheitenInformationen zu Krankheiten• Informationen zu eigenen WertenInformationen zu eigenen Werten• Zugriff auf die eigene PatientenakteZugriff auf die eigene Patientenakte• Informationen zu Arzt, Krankenhaus oder Informationen zu Arzt, Krankenhaus oder

VersicherungVersicherung– Sprechstunden, Besuchszeiten, ParkplatzSprechstunden, Besuchszeiten, Parkplatz– Benchmarking Benchmarking im Qualitätsbereich Linkim Qualitätsbereich Link– VersicherungsvergleichVersicherungsvergleich

Page 45: Medizinische Statistik und Informationsverarbeitung Quade Institut für Medizinische Statistik, Dokumentation und Datenverarbeitung

Aufbau von SuchmaschinenAufbau von Suchmaschinen

Spider / Crawler Spider / Crawler (robot.txt)(robot.txt)

IndexerIndexer

Broker (Schnittstelle Broker (Schnittstelle zum Benutzer) zum Benutzer)

Page 46: Medizinische Statistik und Informationsverarbeitung Quade Institut für Medizinische Statistik, Dokumentation und Datenverarbeitung

Spider / CrawlerSpider / Crawler

Nur ein Teil des WWW-Bereichs wird Nur ein Teil des WWW-Bereichs wird von einem Crawler erfaßt.von einem Crawler erfaßt.

Häufig werden Links nicht Häufig werden Links nicht weiterverfolgt bei:weiterverfolgt bei:

dynamisch gestalteten Webseiten, dynamisch gestalteten Webseiten, Frames, Java und Bildern.Frames, Java und Bildern.

Page 47: Medizinische Statistik und Informationsverarbeitung Quade Institut für Medizinische Statistik, Dokumentation und Datenverarbeitung

robots.txtrobots.txt

User-agent: *User-agent: *

Disallow: /usage/Disallow: /usage/

Disallow: /dimdi/Disallow: /dimdi/

Disallow: /standard/Disallow: /standard/

Disallow: /standards/HL7/Disallow: /standards/HL7/

Disallow: /niedergel/Disallow: /niedergel/

Disallow: Disallow: /epileptologie/epi_info/physicians//epileptologie/epi_info/physicians/

Page 48: Medizinische Statistik und Informationsverarbeitung Quade Institut für Medizinische Statistik, Dokumentation und Datenverarbeitung

BenutzerschnittstelleBenutzerschnittstelle

Basic Search: Basic Search:

+,-+,-

Groß/klein SchreibungGroß/klein Schreibung

Wildcards: *Wildcards: *

Phrasen in Hochkommata Phrasen in Hochkommata

Advanced Search:Advanced Search:

Boolsche Algebra: AND, OR, XOR, Boolsche Algebra: AND, OR, XOR, NOT, NEARNOT, NEAR

Page 49: Medizinische Statistik und Informationsverarbeitung Quade Institut für Medizinische Statistik, Dokumentation und Datenverarbeitung

Beispiel: AltaVistaBeispiel: AltaVistagmds:gmds:

GMDS:GMDS:

gmds gmds konferenz:konferenz:

+gmds +gmds konferenz:konferenz:

+gmds +gmds +konferenz:+konferenz:

„„gmds gmds konferenz“:konferenz“:

2943 2943 DokumenteDokumente

1418 1418 DokumenteDokumente

90310 90310 DokumenteDokumente

2955 2955 DokumenteDokumente

62 62 DokumenteDokumente

0 Dokumente0 Dokumente

Page 50: Medizinische Statistik und Informationsverarbeitung Quade Institut für Medizinische Statistik, Dokumentation und Datenverarbeitung

RankingRanking

Schlüsselwortdichte (Benachteiligung Schlüsselwortdichte (Benachteiligung ausführlicher Dokumente)ausführlicher Dokumente)

Meta-Tags (oft manipuliert)Meta-Tags (oft manipuliert)

Link PopularityLink Popularity (science citation (science citation index)index)

Verkauf von Ranking-Prioritäten statt Verkauf von Ranking-Prioritäten statt WerbungWerbung

Neuere AnsätzeNeuere Ansätze

Page 51: Medizinische Statistik und Informationsverarbeitung Quade Institut für Medizinische Statistik, Dokumentation und Datenverarbeitung

AktualitätAktualität

Anzahl der Dokumente Anzahl der Dokumente überschreitet die Kapazität der überschreitet die Kapazität der SuchmaschinenSuchmaschinen

Scannen der Dokumente in Scannen der Dokumente in mehrmonatlichen Abständenmehrmonatlichen Abständen

Zulassen mehrerer „no Zulassen mehrerer „no connection„ für bereits indexierte connection„ für bereits indexierte DokumenteDokumente

Keine Strafen für tote Links in Keine Strafen für tote Links in DokumentenDokumenten

Page 52: Medizinische Statistik und Informationsverarbeitung Quade Institut für Medizinische Statistik, Dokumentation und Datenverarbeitung

VerzeichnisseVerzeichnisse

Qualität der Bewertung liegt Qualität der Bewertung liegt allein bei dem Redaktionsteamallein bei dem Redaktionsteam

Nur wenige Dokumente können Nur wenige Dokumente können erfaßt werdenerfaßt werden

Großer finanzieller Anreiz zur Großer finanzieller Anreiz zur ManipulationManipulation

Page 53: Medizinische Statistik und Informationsverarbeitung Quade Institut für Medizinische Statistik, Dokumentation und Datenverarbeitung

BenutzerschnittstelleBenutzerschnittstelle