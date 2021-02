Das Google-Tochterunternehmen Kaggle hat den neuesten Report zu seiner jährlich durchgeführten Comunity-Umfrage veröffentlicht: Die Ergebnisse des State of Machine Learning and Data Science 2020 sind da. Sie basieren auf den Antworten von 13 % der insgesamt 20.036 Befragten, die angaben, aktuell als Data Scientists beschäftigt zu sein – somit bezieht sich der Survey auf 2.675 Personen, die zum Thema ML und Data Science Rede und Antwort standen. Wie ist es um die aktuelle Lage auf dem Markt bestellt?

IDEs und Frameworks

Beginnen wir zunächst mit den beliebtesten IDEs und Frameworks. Dort waren jeweils Mehrfachnennungen möglich. Als beliebteste IDE gaben die befragten Data Scientists mit 74,1 % JupyterLab an. Auf Platz zwei liegt Microsofts Quellcode-Editor Visual Studio Code, der 33,2 % erzielt, während auf Platz drei die JetBrains-IDE PyCharm mit 31,9 % verweilt.

In Bezug auf Frameworks liegt die Python-Bibliothek Scikit-learn vorne, die von 82,8 % der Befragten verwendet wird. Danach folgen TensorFlow und Keras, die in Kombination für Deep Learning verwendet werden, mit jeweils 50,5 %. Unter den diesjährigen Neuankömmlingen in der Liste ist das R-basierte Tidymodels mit über 7 % am beliebtesten.

Gehalt

Und weiter geht es mit dem Thema, das stets auf brennendes Interesse stößt: Wie viel verdienen Data Scientists? Das Einkommen der Befragten wird im Report in USD angegeben. Im Ländervergleich schneiden die USA in Bezug auf das Gehalt am besten ab: Das Medianeinkommen für Data Scientists liegt dort bei 125.000-149.999 USD im Jahr. Auf Platz zwei liegt Deutschland mit einem Medianeinkommen von 70.000-79.999 USD, Platz drei geht mit 40.000-49.999 USD an Japan.

Deutlich niedriger fallen die Medianeinkommen von Data Scientists in Russland und Brasilien mit jeweils 10.000-14.999 USD sowie mit 7.500-9.999 USD in Indien aus, das mit 21,8 % der Teilnehmer das in der Umfrage am stärksten vertretene Land war.

Demographisches

Die Mehrheit der Befragten war zum Zeitpunkt der Befragung unter 35 Jahre alt; 6,9 % gar erst 18 bis 21. Es fällt weiterhin auf, dass die meisten der Befragten sich dem männlichen Geschlecht zuordnen, nämlich 82 Prozent – ein geringer Unterschied zu den 84 Prozent im Vorjahr. Als Frauen ordnen sich 16,4 % der Befragten ein. Auf die diesmal neu eingeführten Kategorien „Nichtbinär“ und „Vorziehen, es selbst zu beschreiben“ entfallen 0,3 % bzw. 0,4 %. Eine Aussage zur Frage nach dem Geschlecht verweigerten 1,1 Prozent.

Einen Hochschulabschluss besitzt mit 92,9 Prozent die überwiegende Mehrheit der Befragten: Darunter haben 51,5 % haben ein Masterstudium, 24,2 % ein Bachelorstudium und 17,2 % eine Promotion vorzuweisen.

Die Ergebnisse des State of Data Science and Machine Learning 2020 stellt Kaggle sowohl in einer PDF-Zusammenfassung als auch in Form des Rohdatensatzes zur Verfügung.