Michael Berthold (Informatiker)

Michael R. Berthold (* 6. August 1966 in Stuttgart) ist ein deutscher Informatiker, Unternehmensgründer, Wissenschaftler und Autor. Er hatte den Lehrstuhl für Bioinformatik und Information Mining an der Universität Konstanz inne und ist Ehrenprofessor an der Óbuda Universität.[1] Er ist außerdem Mitbegründer der Software KNIME und seit 2017 Präsident und Geschäftsführer der KNIME AG.[2]

Frühes Leben und Ausbildung

Berthold wurde 1966 in Stuttgart, Deutschland, geboren. Er erhielt 1992 ein Diplom in Informatik und promovierte 1997 zum Dr.rer.nat., beides an der Universität Karlsruhe.[3]

Er ist Ururenkel von Gottfried Berthold, Professor für Botanik an der Universität Göttingen von 1887 bis 1923.

Karriere

Berthold begann seine akademische Karriere 1991 als Gastwissenschaftler an der Carnegie Mellon University. Danach war er 1994 Gastwissenschaftler an der Universität Sydney und 1993 Forscher an der Universität Karlsruhe. Von 1997 bis 2000 war er BISC-Forschungsstipendiat und Dozent an der University of California, Berkeley. Von 2003 bis 2024 war er ordentlicher Professor und Lehrstuhlinhaber für Bioinformatik und Information Mining an der Universität Konstanz, Deutschland.[3] 2017 nahm er eine Beurlaubung, um Vollzeit-CEO der KNIME AG in Zürich, Schweiz, zu werden.[4]

Bei IEEE war Berthold von 2010 bis 2011 Präsident der IEEE Systems, Man, and Cybernetics Society.[5]

Wirken

Berthold verfasste über 250 Veröffentlichungen, während er sich in seiner Forschung auf die Nutzung von Methoden des maschinellen Lernens für die interaktive Analyse großer Informationsbestände fokussierte. Er ist Herausgeber und Mitautor von Lehrbüchern, darunter 'Guide To Intelligent Data Science und Intelligent Data Analysis.[6]

Berthold ist Fellow des Institute of Electrical and Electronics Engineers (IEEE), ehemaliger Präsident der North American Fuzzy Information Processing Society[7] und ehemaliger Präsident der IEEE Systems, Man, and Cybernetics Society. Er ist Associate Editor der Zeitschriften Data Mining and Knowledge Discovery (DMKD),[8] Knowledge and Information Systems (KIS), Journal of Cheminformatics (JCIS)[9] und International Journal of Computational Intelligence in Bioinformatics and Systems Biology (IJCIBSB). Er war an der Organisation verschiedener Konferenzen beteiligt, insbesondere der IDA-Reihe von Symposien zur Intelligent Data Analysis.[10]

Forschung

Berthold konzentriert seine Forschung auf große und heterogene Datenquellen, mit besonderem Schwerpunkt auf Methoden der KI (Regellernen, neuronale Netze, Fuzzy-Logik und allgemeines maschinelles Lernen).[11]

Fuzzy-Modelle

Berthold veröffentlichte Methoden zur Extraktion von Fuzzy-Modellen aus Daten, basierend auf konstruktiven Methoden zum Aufbau probabilistischer neuronaler Netze.[12] Er entwickelte ähnliche Algorithmen zur Extraktion von Fuzzy-Regelmodellen.[13] Anschließend erweiterte er diese Modelle über die Klassifikation hinaus und entwarf Algorithmen, um Regressionsmodelle, sogenannte Fuzzy-Graphen, automatisch aus Daten zu extrahieren.[13]

Bisociative Wissensentdeckung

An der Universität Konstanz initiierte Berthold ein europäisches Projekt (EU FP7 BISON), das sich auf bisociative Methoden zur Gewinnung von Erkenntnissen aus vielfältigen Datenquellen konzentrierte. Das Konsortium erstellte Ergebnisse, die im herausgegebenen Band 'Bisociative Knowledge Discovery' zusammengefasst sind.[14]

Widening von Machine-Learning-Algorithmen

Berthold war der Erste, der die Idee des widened maschinellen Lernens einführte, das parallele Ressourcen nutzt, um die Modellgenauigkeit zu verbessern, anstatt sich wie üblich auf Beschleunigung zu konzentrieren. Er publizierte verschiedene generische Methoden zur Feinabstimmung von Data-Mining-Algorithmen.[15][16] Später führte er eine eingehende Analyse des Konzepts des Widened Data Mining durch, das darauf abzielt, den Einfluss von Heuristiken zu reduzieren, indem mehr als nur eine geeignete Lösung in jedem Schritt erforscht wird.[17] 2017 schlugen Berthold und sein Team den Bucket Selector vor, eine modell-unabhängige randomisierte Auswahlstrategie, die in Fällen ohne Diversitätsmaß besser als bestehende Auswahlstrategien abschneidet.[18]

Designmuster für Data Science

2023 führten Berthold und seine Co-Autoren den Begriff der visuellen Designmuster für Data Science ein.[19] Die vorgestellten Methoden nutzen Graphmuster und passen sich somit natürlich dem Datenflussparadigma an, das den meisten Data-Science-Werkzeugen zugrunde liegt.

Auszeichnungen und Ehrungen

  • 2001 – KS Fu Award, Nordamerikanische Gesellschaft für Fuzzy-Informationsverarbeitung.[3]
  • 2010 – Fellow des Institute of Electrical and Electronics Engineers (IEEE)[5]
  • 2011 – Ehrendoktor, Óbuda-Universität, Budapest[3]

Veröffentlichungen (Auswahl)

Bücher

  • Advances in Intelligent Data Analysis – Reasoning about Data (1997) ISBN 9783540408130
  • Intelligent Data Analysis 2nd Edition (2007) ISBN 9783540430605
  • Bisociative Knowledge Discovery (2012) ISBN 9783642318306
  • Guide To Intelligent Data Science (2020) ISBN 9783030455736

Artikel

  • Berthold, M., & Diamond, J. (1994). Boosting the performance of rbf networks with dynamic decay adjustment. Advances in neural information processing systems, 7.
  • Berthold, M. R., & Huber, K. P. (1998). Missing values and learning of fuzzy rules. International Journal of Uncertainty, Fuzziness and Knowledge-Based Systems, 6(02), 171–178.
  • Berthold, M. R., & Huber, K. P. (1999). Constructing fuzzy graphs from examples. Intelligent Data Analysis, 3(1), 37–53.
  • Eliceiri, K. W., Berthold, M. R., Goldberg, I. G., Ibáñez, L., Manjunath, B. S., Martone, M. E., ... & Carpenter, A. E. (2012). Biological imaging software tools. Nature methods, 9(7), 697–710.
  • Berthold, M. R., Fillbrunn, A., & Siebes, A. (2021). Widening: using parallel resources to improve model quality. Data Mining and Knowledge Discovery, 35(4), 1258–1286.
  • Berthold, M.R., Brookhart, D., Gerber, S., Hayasaka, S., Widmann, M. (2023). Towards Data Science Design Patterns. Advances in Intelligent Data Analysis XXI. IDA 2023. Lecture Notes in Computer Science, vol 13876. Springer.
Commons: Michael Berthold – Sammlung von Bildern, Videos und Audiodateien

Einzelnachweise

  1. Chair for Bioinformatics and Information Mining. In: uni-konstanz.de. (englisch).
  2. Interview: Michael Berthold, President and Founder of KNIME, on Data Mining, Startups, and Visual Workflow. In: kdnuggets.com. (englisch).
  3. a b c d Prof. Dr. Michael Berthold. In: Universität Konstanz.
  4. KNIME Team. In: KNIME AG. (englisch).
  5. a b Michael R. Berthold. In: IEEE Xplore. (englisch).
  6. Books by Michael Berthold. In: isbns.net. (englisch).
  7. NAFIPS. In: ualberta.ca. Ehemals im Original (nicht mehr online verfügbar); (englisch).@1@2Vorlage:Toter Link/nafips.ece.ualberta.ca (Seite nicht mehr abrufbar. Suche in Webarchiven)
  8. Data Mining and Knowledge Discovery. In: springer.com. Ehemals im Original (nicht mehr online verfügbar); (englisch).@1@2Vorlage:Toter Link/www.springer.com (Seite nicht mehr abrufbar. Suche in Webarchiven)
  9. Journal of Cheminformatics. In: biomedcentral.com. (englisch).
  10. Michael R. Berthold. In: the dblp computer science bibliography. (englisch).
  11. Michael R Berthold. In: ResearchGate. (englisch).
  12. Michael J. Berthold, Jay Diamond: Boosting the Performance of RBF Networks with Dynamic Decay Adjustment. In: neurips.cc. (englisch).
  13. a b MISSING VALUES AND LEARNING OF FUZZY RULE. (PDF) In: uni-konstanz.de. Ehemals im Original (nicht mehr online verfügbar); (englisch).@1@2Vorlage:Toter Link/www.uni-konstanz.de (Seite nicht mehr abrufbar. Suche in Webarchiven)
  14. Constructing fuzzy graphs from examples. (PDF) In: uni-konstanz.de. Ehemals im Original (nicht mehr online verfügbar); (englisch).@1@2Vorlage:Toter Link/www.uni-konstanz.de (Seite nicht mehr abrufbar. Suche in Webarchiven)
  15. Michael R Berthold, Alexander Fillbrunn: Widening: using parallel resources to improve model quality. In: researchgate.net. (englisch).
  16. Zaenal Akbar, Violeta N Ivanova, Michael R Berthold: Parallel Data Mining Revisited. Better, Not Faster. In: researchgate.net. (englisch).
  17. Violeta N Ivanova, Michael R Berthold: Diversity-Driven Widening. In: researchgate.net. (englisch).
  18. Alexander Fillbrunn, Leonard Wörteler, Michael Grossniklaus, Michael R Berthold: Bucket Selection: A Model-Independent Diverse Selection Strategy for Widening. In: researchgate.net. (englisch).
  19. Michael R Berthold, Dashiell Brookhart et al.: Towards Data Science Design Patterns. In: springer.com. (englisch, doi:10.1007/978-3-031-30047-9_5).