Ist Künstliche Intelligenz (AI) der Traktor des ... · 1.2. Auswirkung der Digitalisierung •3...

Preview:

Citation preview

Ist Künstliche Intelligenz (AI) der Traktor des Dienstleistungssektors?

Erfahrungen mit maschinellen Verfahren in Bibliothek und Dokumentation

Dipl.-Inf.wiss. Manfred Hauer M.A.

1.2. Auswirkung der Digitalisierung

• 3 Thesen:

• Frey/Osborne – Oxford 2013: 47 % der Tätigkeiten in den USA sind automatisierbar

• ZEW Mannheim 2015: 42 % der Tätigkeiten haben hohe Automatisierungswahrscheinlichkeit, aber durch Synthese mit interaktiven Tätigkeiten vermutlich nur 12 % hohe Automatisierungswahrscheinlichkeit

• IAB Nürnberg 2015 (Wolter u.a.): Bis 2025 Verschiebung von 920.000 Arbeitsplätzen: 490.000 Verlust und 450.000 neue Arbeitsplätze

1.3. Thesen des Statistischen Bundesamtes:

• > Beschleunigung von Innovationszyklen und höhere Relevanz von persönlicher Weiterbildung und Beschäftigungsfähigkeit (Implikationen für Politik, Unternehmen, Erwerbstätige)

• > Entgrenzung von Erwerbsarbeit und Privatsphäre durch mobiles Arbeiten und mobile Erreichbarkeit

• > höhere Relevanz von Solo-Selbstständigkeit im Zusammenhang mit der Direktvermarktung von Dienstleistungen

• > möglicherweise höhere Relevanz von Nebenjobs und geringfügiger Beschäftigung im Gigwork-Dienstleistungssegment

1.4. Meine These

• Menschen machen immer was technisch möglich ist (moralische Barrieren evtl. sehr spät und mit geringem Wirkungsgrad)

• AI kann immer rascher und massiv menschliche Arbeit ersetzen

• Wachsender Fachkräftemangel in vielen Bereichen

• Nationale Egoismen, ökologische, politische, Finanz-Krisen erschweren Handel, arbeitsteilige Produktion, Migration, führen zu Reduktion des Steueraufkommens und öffnen den Markt für AI als Substitut von menschlicher Arbeit

• Keine Idee, wo und wie die erwerbsarmen Menschen sinnvolles, gesundes Leben verbringen sollen, weitere Polarisierung

2. Meine kleine Technikgeschichte

- 1920er Jahre: Festnetztelefon, erstes Auto im Dorf: mein Großvater

- 1940er Jahre: mobiler Funk, verschlüsseltes Morsen: mein Vater

- 1975: SPSS auf Großrechner mit Lochkarten

- 1981: Retrieval-Syteme - Dialog mit HP-Terminal – 20 min Textübertragung

- 1983: Erster PC mit Datex-P – bald 20 Hosts – 10 MB Disk, Heureka als lokale Retrieval-Datenbank, Genesys IuD, Textverarbeitung, Tabellenk.

- 1986: STAR als Retrieval-System, INDEX für Thesaurusentwicklung

- 1989: Tragbarer PC mit MS-DOS und 1991 Mobiltelefon

- 1992: Imaging & OCR an STAR angedockt

- 1994: maschinelle Indexierung mit Softex IDX

- 1994 Lotus Notes - dokumentortientiertes Datenbank-Management System mit integriertem Retrieval-System und Datenbankreplikation

- 1994 FIRST! – individuelle Tageszeitung

- 1994 Professionelle Software-Entwicklung: Information Center

- 2001 intelligentCAPTURE – maschinelle Indexierung von TOCs

- 2003 intelligentSEARCH = dandelon.com

- 2017 Switch auf Apache Lucene (2019 auf Elastic Search)

3. intelligentCAPTURE & intelligentSEARCH

• Scannen mit Image-Optimization oder Text-Extraktion aus PDF

- Inhaltsverzeichnisse von Büchern

- Aufsätze aus Zeitschriften mit Abstract, teils Volltext

- Bücher im Volltext - teils strukturiert in Teile

• OCR für 200 Sprachen mit Spracherkennung

• Maschinelle Indexierung für 100 Sprachen durch Integration von neuronale Übersetzung und linguistischer Indexierung

• Übersetzung in 100 Sprachen (Titel, Deskriptoren, Texte)

• Publishing in Bibliothekssysteme und internationaler Austausch via dandelon.com mit öffentlichem Zugang für Endbenutzer

1. Retrieval in dandelon.comhttps://www.dandelon.com

E1: Mauern einschaliger Baukörper - XR

E1: mauern einschaliger Baukörper - CAI

• Author Batran, Balder Bläsi, Herbert Frey, Volker Hillberger, Gerd Hühn, Klaus Köhler, Klaus Kraus, Eduard Rothacher, Günter Stumm, Kai-Michael

• Title Lernfeld Bautechnik• AGI Unique ID AT001250D99AAAB612A9FC1258250002E3EFF

• Library Keywords Bautechnik; Lehrbücher; Einführungen; +TEN 050; TEN; f3/LEHRB

• Descriptors Schnittholz[100]; Holzbau[93]; Holzschraube[88]; Kalksandstein[35]; Feld[32]; Stahlbetonbau[28]; Mörtel[26]; zylindrischer Körper[21]; Leichtbeton[20]; Baustahl[18]; Kunststein[18]; Wärmedämmung[18]; Estrich[15]; Schallschutz[14]; Konstruktion[14]; Bauplanung[13]; Blei[13]; Kupfer[13]; Korrosionsschutz[13]; Fußboden[12]; Schraubverbindung[12]; Duroplast[11]; Elastomere[11]; Säure[11]; Thermoplast[11]; Wärmespeicherung[11]; Metallverbindung[11]; Nietverbindung[11]; Schweißverbindung[11]; Aufbau[10]; Datenschutz[10]; Kohäsion[9]; Asphalt[9]; Dämmstoff[9]; Wärmemenge[9]; Fliese[9]; Abdichten[8]; Maßeinheit[8]; Aluminium[7]; Maßzahl[7]; Brandwand[7]; Entwässerung[7]; Schalung[7]; Grobkeramik[6]; Zeichnung[6]; Adhäsion[6]; Dachstuhl[6]; Geschichte[6]; Klassifikation[6]; Abwicklung[5]; Anforderung[5]; Berechnung[5]; Hardware[5]; Gewichtskraft[5]; Sicherung[5]

• Free Descriptors Lernfeld[32]; Baukörper[12]; Mauerstein[9]; Holzschutz[6]; Stahlbetonbauteil[6]; Bauzeichnung[5]; Außenputz[4]; Baukalk[4]; Baurundholz[4]; Bauschnittholz[4]; Brettschichtholz[4]; Grundstufe[4]; Holzverbindung[4]; Innenputz[4]; Mauermörtel[4]; Nadelschnittholz[4]; Wandtrockenputz[4]; Arbeitsgerüst[3]; Bauabsteckung[3]; Baugrubensicherung[3]; Baustellensicherung[3]; Blechformteilverbindung[3]; Bodenklinkerplatte[3]; Bolzendübelverbindung[3]; Dachkonstruktion[3]; Gesteinskörnung[3]; Grundkonstruktion[3]; Grundleitung[3]; Hausgrundstücksentwässerung[3]; Holzkonstruktion[3]; Holztrocknung[3]; Ingenieurholzbau[3]; Maueranschluss[3]; Maßlinienbegrenzung[3]; Maßordnung[3]; Mörtelbereitung[3]; Mörtelmischung[3]; Porenbetonstein[3]; Projektbeschreibung[3]; Randeinfassung[3]; Roheisengewinnung[3]; Schalungselement[3]; Schalungskonstruktion[3]; Schnurgerüst[3]; Stahlgewinnung[3]; Tabellenanhang[3]; Teilstein[3]; Wasserhaltung[3]; Baustelleneinrichtungsplanung[2]; Fachwerkwand[2]; Massenermittlung[2]; Maßeintragung[2]; Mengenermittlung[2]; Parallelprojektion[2]; Produktlinienanalyse[2]; Streckenteilung[2]; Verkehrsfläche[2]; Winkelteilung[2]; Wärmeschallschutz[2]; Bauschaden[1]; Baustelleneinrichtungsplan[1]; Bauzeitenplan[1]; Bewehrungsplan[1]; Dichtungsbahn[1]; Dreisatzrechnen[1]; Dämmschicht[1]; Entwässerungsplan[1]; Fundamentplan[1]; Holzschraubenverbindung[1]; Mauerschicht[1]; Mauerverband[1]; Mörtelfuge[1]; Nagelverbindung[1]; Prozentrechnen[1]; Schalungsplan[1]; Wachstumsfehler[1]; Wärmeausbreitung[1]; Anreißgerät[0]; Anwendungsbeispiel[0]; Baufachleute[0]; Baunennmaß[0]; Baurichtmaß[0]; Baustoffbedarf[0]; Bewehrungsarbeit[0]; Bildquellenverzeichnis[0]; Bodenart[0]; Branchensoftware[0]; Estricharbeit[0]; Evaprinzip[0]; Fußweg[0]; Gründungsart[0]; Handelsform[0]; Hinweislinie[0]; Holzart[0]; Holzbearbeitungswerkzeug[0]; Holzbedarf[0]; Holzliste[0]; Holzschädling[0]; KaiMichael[0]; Linienart[0]; Mauerecke[0]; Mauermaß[0]; Maßhilfslinie[0]; Mörtelgruppe[0]; Nadelbaum[0]; Normschrift[0]; Pfettendachstuhl[0]; Quellverhalten[0]; Sachwortverzeichnis[0]; Schaltechnik[0]; Schrägbildart[0]; Schrägbilder[0]; Sortierklasse[0]; Stahlliste[0]; Stemmwerkzeug[0]; Verbandsart[0]; Vermessungsarbeit[0]; Wandart[0]; Wandbodenbelag[0]; Zeichenregel[0]; Überbindemaß[0]

• Noun Phrases gepresste Fliese; innerer Aufbau; projektbezogene Aufgabe; zahlreiche Abbildung; äußerer Aufbau; allgemeine Eigenschaft; aussteifende Wand; bindemittelgebundene Platte; bitumenhaltiger Stoff; chemischer Aufbau; chemischer Holzschutz; chemische

Korrosion; einschaliger Baukörper; elektrisches Betriebsmittel; elektrochemische Korrosion; ergänzende Information; europäischer Laubbaum; europäischer Nadelbaum; geometrische Grundkonstruktion; geschichtliche Entwicklung; handlungsorientierte Aufgabe; kegelförmiger Körper; keramische Fliese; künstlicher Mauerstein; künstlicher Stein; makroskopischer Aufbau; mehrfarbige Abbildung; mikroskopischer Aufbau; nichttragende Wand; offene Wasserhaltung; prismatischer Körper; projektbezogene Aufgabe; pyramidenförmiger Körper; rechter Winkel; rechtwinklige Parallelprojektion; regelmäßiges Vieleck; schräge Parallelprojektion; senkrechtes Lot; stranggepresste Platte; technische Eigenschaft; tragende Wand; umweltfreundlicher Bau; unregelmäßiges Vieleck; unterkellertes Gebäude; vieler Versuch; wichtige Holzart; zeichnerische Darstellung; zerstörendes Insekt; zerstörender Pilz; zimmermannsmäßige Holzverbindung

• Countries Deutschland C4EUGE

E1: einschaliger Baukörper - LMS ALEPH

E2: digitalisierte Automobilindustrie - CAI

• Author Winkelhake, Uwe

• Title The digital transformation of the automotive industry

• AGI Unique ID AT001FBE1DC95177B89C0C1258250002DE121

• Descriptors Analog-Digital-Umsetzung[100]; Automobilindustrie[64]; mathematische Transformation[52]; Dienst[47]; Vertrieb[44]; Informationstechnik[27]; Geschäftsprozess[22]; Entwicklung[20]; Fahrplan[19]; Markt[18]; Service[15]; Unternehmenskultur[15]; strategische Unternehmensplanung[14]; Mobilität[13]; Wissensmanagement[12]; Änderungsmanagement[12]; Elektroantrieb[10]; Anpassung[10]; Erfahrung[10]; Erwartung[10]; Ausstattung[9]; Führung[9]; Konsolidierung[9]; Projektmanagement[9]; Verkauf[9]; Verteilung[9]; Nanotechnologie[8]; Sicherheit[8]; Kunden[6]; Bildung[5]; Exponentialfunktion[5]; Innovation[5]; Kommunikation[5]; Organisation[5]

• Free Descriptors Mobilitätsdienst[16]; Digitalisierungslösung[5]; Digitalisierungsprojekt[5]; Fahrzeugausstattung[5]; Infrastrukturflexibilisierung[5]; Multichannelverteilung[5]; Transformationsprojekt[5]; Kundenerfahrung[4]; Anwendungsentwicklung[2]; Designdenken[2]; Kundenerwartung[2]; Marktverschiebung[2]; Digitalisierungssituation[1]; Elektromobilität[1]; Fahrzeugmobilität[1]; Nutzentransparenz[1]; Robotik[1]; After[0]; Arbeitsmodell[0]; Automobilbank[0]; Automobilmarkt[0]; Datensee[0]; Enterprise[0]; Fahrzeugeigentum[0]; Geschäftsmodell[0]; Karrieremodell[0]; Kohlenstoffnanoröhre[0]; Kooperationsform[0]; Marktpotenzial[0]; Projektmanagementmethode[0]; Quantencomputer[0]; Sicherheitsstrategie[0]

• Noun Phrases prototypfreie Entwicklung; zentral ITArchitektur; agile Projektmanagementmethode; allgemeiner Motor; automatisierter Geschäftsprozess; autonomes Fahren; businessorientierte Sicherheitsstrategie; definierte Umgebung; digitale Bildung; digitaler Lebensstil; digitaler Nomade; digitales Produkt; digitale Transformation; digitalisierte Automobilbank; digitalisierte Automobilindustrie; effizienter Prozess; eingebettet ITArchitektur; erweiterte Realität; exponentielles Wachstum; flexible Produktionsstruktur; großes Daten; heißes Thema; innovatives Arbeitsmodell; innovatives Digitalisierungsprojekt; innovativer Prozess; internetbasierte Multichannelverteilung; kognitives Rechnen; leistungsstarkes Netzwerk; maschinelles Lernen; microservicebasierte Anwendungsentwicklung; mobile Anwendung; mobile Strategie; mobile Wirtschaft; mobiles Ökosystem; nachhaltige Digitalisierung; neues Berufsprofil; neuer Weg; neuronales Netz; offene Innovation; organisatorischer Aspekt; persönliches Daten; prozessbasierte Entwicklung; technologische Singularität; verbundener Dienst; zukünftige Kundenerwartung; zukünftiger Mitarbeiter

1 x german + 1 x english source documents

https://serveragi11.agi-imc.de/dandelon-download/attachments/dandelon/ids/AT001FBE1DC95177B89C0C1258250002DE121.PDF?contentDisposition=inline#search=AT001FBE1DC95177B89C0C1258250002DE121&pagemode=thumbs

https://serveragi11.agi-imc.de/dandelon-download/attachments/dandelon/ids/DEAGID984CFF9842FD48DC12581F10031617F.PDF?contentDisposition=inline#search=vision%20digitalisierte%20automobilindustrie%202030&pagemode=thumbs

UB St. Gallen ALEPH

UB St. Gallen intelligentCAPTURE

E3: Seven lingual indexing

• Author De Concini, Ennio (VerfasserIn) Polia, Mario (VerfasserIn)

• Title Il paradiso del diavolo

• AGI Unique ID DE02771662BB971034335C12581BC0036A03F

• Descriptors Dämon[64]; Magie[48]; Hammer[24]; Messer[24]; Fee[20]; Kräuter[16]; Teufel[16]; Anatomie[14]; Mädchen[12]; Berg[10]; Christentum[10]; Dokument[10]; Reise[10]; Religiosität[10]; Wasser[10]

• Free Descriptors Stockdämon[8]; Bastelmesser[6]; Kräutermagie[6]

• Noun Phrases böser Blick; klein Grimoire; magisches Bastelmesser; mittler Guerin; traditionelles Christentum; traditionelle Religiosität; tägliche Magie

• Countries Italien C4EUIT

• Names of Persons and Organisations Armando Zauberer; Baculus Daemonum; Concini; Daemonum Malleus Hammer; Mario POLIA PARADISE; Teufel Paradies Ennio De

Title in French: "Le paradis du diable"

Library keywords in Portuguese

Machine indexing in Dutch

3. T1 Optical Character Recognition (OCR) -with Abbyy FineReader Engine 12• 1. Document structure - where is text and in which way it is sorted (text, tables, images)

• 2. Narrowing down to character level and comparing patterns

• 3. Building probabilistic hypothesis about words and lines

• 4. Comparison with word patterns and dictionaries in 48 languages

• 5. Final decisions and export of text, font, graphics, layout in multiple formats

• Principles: Integrity, Purposefulness and Adaptability

• The principle of integrity says that the observed object must always be considered as a “whole” consisting of many interrelated parts. The principle of purposefulness supposes that any interpretation of data must always serve some purpose. And the principle of adaptability means that the program must be capable of self-learning.

3. T3 Text Analytics (IAI Autoindex / CAI-Engine)Linguistic and Statistic (German)

• 1. Document heuristic - first part and last part is more important than long part between.

• 2. Finding words, sentences, paragraphs

• 3. Analyzing each word, word variant, compound words, word types (60.000 German words with grammar rules)

• 4. Term weight according to word type, position in sentence, structure of sentences, number of occurrences, knowledge domain

• 5. Extraction of nouns, compound words, noun phrases, names (people, places), unknown words

• 6. Increase term weight if term is known in the build in 220.000 word thesaurus

3. T3. Translation - with Google Translation API• Statistical model + since 2016 neural network model

Learning from bilingual text corpora

• Final translation: source language -> English -> target language

• https://en.wikipedia.org/wiki/Google_Translate

• https://en.wikipedia.org/wiki/Google_Neural_Machine_Translation

3. T4 Semantic query expansion (millions of word-word relations)• Apache Lucene document index with build in terminology index from

different domain thesauri (Lucene is embedded in IBM Domino)

• Personal collection of thesauri from 30 years of development

„Bibliothek Dokumentation“ 130.137 Hits

„Bibliothek Dokumentation“ 228.683 Hits

AGI - Information Management Consultants

Dipl.-Inf.wiss. Manfred Hauer M.A.

Mandelring 238 b

67433 Neustadt an der Weinstrasse

Germany

Tel +49 (0) 6321 / 9635-10

https://www.agi-imc.de

https://www.agi-imc.de/dandelonXR.nsf

Manfred.Hauer@agi-imc.de

Google Maps

Literatur

• G. David Garson: Neural Networks. An Introductory Guid for Social Scientists. 1998. London ISBN 07619 5730 8

• Ende 30er/Anfang 40er Jahre: McCulloch and Pitts, 1994

• 1956 erste Computer-Implementierung IBM Research, Nathaniel Rochester - erste Konferenz zu Artifical Intelligence

• AI-Sprachen regelbasiert - ohne daucerhaften Erfolg - 1989 neuer Durchbruch für Neural Networks durch Hornik u.a. - u.a. Titel "Neuralware, Inc." - 1990 mit vordringen der Microcomputer

• 1994 Document Retrieval (Kim)

• Arbeitsmarkt im Wandel – Wirtschaftsstrukturen, Erwerbsformen und Digitalisierung

Statistisches Bundesamt | WISTA | 3 | 2018 https://www.destatis.de/DE/Publikationen/WirtschaftStatistik/2018/03/ArbeitsmarktWandel_032018.pdf?__blob=publicationFile

Recommended