Crypto News

Das HUMAN-Protokoll definiert den Markt für Datenkennzeichnung und Crowdsourcing neu, um eine bessere Genauigkeit zu erzielen

Künstliche Intelligenz (KI) kann ihren Zweck nur erfüllen, wenn sie auf qualitativ hochwertigen Daten trainiert wird. Der Erfolg eines KI-Algorithmus hängt maßgeblich von der Qualität und Quantität der verwendeten Trainingsdaten ab. Dementsprechend sollte es nicht überraschen Fast 80 % der gesamten Zeit, die für die Erstellung eines KI-Projekts aufgewendet wird, wird der Optimierung von Trainingsdaten gewidmeteinschließlich Schritte wie Akkumulation, Filterung und Datenkennzeichnung.

Die meisten KI-Projekte stehen vor der schwierigen Aufgabe, qualitativ hochwertige Daten zu sammeln oder zu erwerben. Es gibt mehrere Fälle, in denen Projekte häufig mit nicht gekennzeichneten Daten oder gekennzeichneten Daten von geringer Qualität enden. Während in den letzten Jahren mehrere Datenkennzeichnungsdienste entstanden sind, die sich der Herausforderung bis zu einem gewissen Grad stellen, weisen sie ihre eigenen Probleme auf. Die Hauptgründe für gekennzeichnete Daten von geringer Qualität sind beispielsweise die Personen, Prozesse oder Technologien, die für die Kennzeichnung verwendet werden.

Aber was genau sind gelabelte Daten?

Datenkennzeichnung: Der Treibstoff für KI-Modelle

Im Zusammenhang mit KI beziehen sich gekennzeichnete Daten auf Daten, die „markiert oder kommentiert“ sind, damit ein maschinelles Lernmodell das gewünschte Ergebnis vorhersagen kann. Im Allgemeinen umfasst der gesamte Datenkennzeichnungsprozess normalerweise mehrere Schritte, wie Datenkommentierung, Klassifizierung, Tagging, Moderation und Verarbeitung.

Es gibt mehrere Ansätze zur Datenkennzeichnung, die entweder unabhängig voneinander oder in Kombination eingesetzt werden können. Dazu gehören die interne Datenkennzeichnung, Outsourcing, Crowdsourcing und die Verwendung von Maschinen (wobei Daten mithilfe von maschinellen Lernalgorithmen gekennzeichnet werden).

Abhängig von der Komplexität des Problems verwenden KI-Projekte oft umfassende Kennzeichnungsprozesse, um nicht gekennzeichnete Daten in die Trainingsdaten umzuwandeln, die sie benötigen, um ihren KI-Modellen beizubringen, welche Muster zu erkennen sind, um die gewünschte Ausgabe zu erzeugen.

Siehe auch  Scholz sagt, dass sich für Deutschland Herausforderungen des Arbeits- und Klimaklimas abzeichnen

Von den vielen verfügbaren Methoden ist Crowdsourcing, bei dem eine Plattform eines Drittanbieters verwendet wird, um auf große Mengen menschlicher Arbeiter gleichzeitig zuzugreifen, eine der am häufigsten verwendeten Taktiken von Projekten zur Kennzeichnung von Daten. In den letzten Jahren haben sich unter anderem mehrere Plattformen wie Amazon MTurk, Appen Meeta Dash, Labelbox und Tagtog als einige der vielversprechendsten Plattformen für das Crowdsourcing menschlicher Arbeitskräfte für die Datenkennzeichnung herauskristallisiert.

Mehrere Projekte haben jedoch Bedenken hinsichtlich der Datenqualität von Crowdsourcing-Plattformen geäußert. Nehmen Sie zum Beispiel das Datenqualitätsproblem mit Amazon Mechanical Turk (MTurk), das bis ins Jahr 2018 zurückreicht. Viele Datenforscher vermuten, dass Daten mithilfe von Bots neben halb- und vollautomatischem Code oder Skripten gekennzeichnet wurden, um Menschen bei der Reaktion zu unterstützen schnell zu bestimmten Datensätzen.

Ein Teil des Problems wurde auf Benutzer von verschiedenen Standorten zurückgeführt, die VPNs verwendeten, um an Umfragen und Fragebögen teilzunehmen, die nicht für ihr Gebietsschema geeignet waren. Da Crowdsourcing-Plattformen menschliche Arbeiter für die Erledigung von Aufgaben angemessen bezahlen, beteiligen sich Benutzer oft an doppelten Aktivitäten, um mehr Einkommen zu erzielen. Beispielsweise können eine Reihe von Benutzern aus verschiedenen Ländern VPN verwenden, um an einem Datenkennzeichnungsprogramm teilzunehmen, das bestimmte Antworten von amerikanischen Einwohnern erfordert. Dies führt zu minderwertigen und unsinnigen Antworten, was wiederum die Datenqualität senkt.

Wenn Daten von geringer Qualität eingereicht werden, wirft dies ernsthafte Fragen zum bestehenden Qualitätssicherungsprozess auf. Da die meisten der bestehenden Crowdsourcing-Plattformen für die Datenkennzeichnung stark zentralisiert sind, ist es wiederum fast unmöglich, die Qualität und den Arbeitsablauf zu beurteilen. All diese Probleme, gepaart mit dem kometenhaften Wachstum der Blockchain-Technologie, haben den Weg für dezentrale und genehmigungsfreie Crowdsourcing-Lösungen geebnet.

Siehe auch  Corona III Tilgungszuschuss bis Ende Juni verlängert

Hier stellt das HUMAN Protocol einen neuartigen neuen Ansatz zur Datenkennzeichnung vor, indem es eine Infrastruktur schafft, die erlaubnislose Arbeitsmärkte unterstützt, die gleichzeitig menschliche Arbeiter mit Arbeit versorgen und Organisationen Zugang zu Arbeitskräften verschaffen – alles ohne zentrale Vermittler.

Erleichterung von genehmigungsfreien Stellenmärkten

MENSCHLICHES Protokoll ermöglicht die Erstellung verteilter Marktplätze für Aufgaben in einem globalen Netzwerk. Denken Sie jedoch daran, dass das HUMAN-Protokoll an sich kein Marktplatz ist. Stattdessen stellt es die notwendigen Tools und die Infrastruktur bereit, um dezentralisierte Marktplätze zu unterstützen.

Das HUMAN-Protokoll ist von Natur aus eine dezentrale und automatisierte Open-Source-Infrastruktur, die einen hybriden Rahmen für die Organisation, Bewertung und Vergütung menschlicher Arbeit bietet. Das HUMAN-Protokoll dient sowohl den Interessen von Arbeitnehmern als auch von Arbeitgebern (Anfragenden). Dadurch kann es in einer Vielzahl von Anwendungsfällen eingesetzt werden, einschließlich Crowdsourcing und Gig-basierten Projekten.

Obwohl das HUMAN-Protokoll nahezu universell anwendbar ist, konzentriert es sich zunächst auf die Unterstützung dezentraler Marktplätze im Zusammenhang mit maschinellem Lernen (ML). Genauer gesagt erleichtert das HUMAN-Protokoll die Erfassung riesiger Mengen qualitativ hochwertiger menschlicher Anmerkungsdaten bei gleichzeitiger Aufrechterhaltung optimaler Service-Levels.

Während das HUMAN-Protokoll ursprünglich aus hCAPTCHA, einem der beliebtesten und getesteten CAPTCHA-Dienste im Web 2.0, hervorgegangen ist, hat sich die Plattform seitdem als völlig einzigartige Einheit etabliert, indem sie die zugrunde liegende Technologie anbietet, um genehmigungsfreie Stellenmärkte zu unterstützen, in denen fast jede Aufgabe – einschließlich Datenkennzeichnung – Crowdsourcing möglich.

Derzeit bietet der HUMAN-Stellenmarkt Video-, Bild- und Textanmerkungsmärkte, auf denen Käufer und Verkäufer zusammengebracht werden. Das zugrunde liegende Protokoll kann einen Job (Aufgabe) auf viele dieser Märkte aufteilen und ihn an die entsprechenden Exchanges (die Anwendungen, die die Arbeiter verwenden, um den Job zu erledigen) senden. Darüber hinaus kann es die Daten auf allen Stellenmärkten gegenprüfen, um die Qualität sicherzustellen.

Siehe auch  Wir interviewen RCRDSHP, eine neue Musik-NFT-Plattform, die auf Flow basiert

Darüber hinaus hat das Team von HUMAN Protocol die besten verfügbaren Tools für jeden Arbeitsmarkt ausgewählt. Sie haben die Exchanges entwickelt und optimieren sie kontinuierlich, um den Arbeitnehmern alles zu bieten, was sie zur Erledigung der angeforderten Aufgaben benötigen. Das Protokoll enthält auch Tools, die eine End-to-End-Qualitätskontrolle über die übermittelten Jobs aufrechterhalten. Dies bedeutet effektiv, dass Anforderer ein deterministischeres Ergebnis erhalten, wenn ähnliche Jobs über denselben Exchange ausgeführt werden.

Schließlich bietet HUMAN Protocol im Vergleich zu stark zentralisierten und mikroverwalteten Plattformen eine vollständig offene Lösung, die es einer Vielzahl von Projekten ermöglicht, seine Infrastruktur zu nutzen. Darüber hinaus bietet es auch die Möglichkeit, Projekten dabei zu helfen, ihre eigenen Tools hinzuzufügen, um die Anforderungen an die Datenkennzeichnung genauer, effizienter und ohne Zwischenhändler zu erfüllen. Am wichtigsten ist, dass die Auflistung, Verteilung und Vergütung von Arbeitsplätzen neben Millionen von Mikrozahlungen automatisiert ist, dank der Anwendung der Blockchain-Technologie des Protokolls, um Transaktionen und Abrechnungen auf geordnete, zuverlässige und faire Weise zu erleichtern.


Quelle: Crypto-News-Flash.com

Sophie Müller

Sophie Müller ist eine gebürtige Stuttgarterin und erfahrene Journalistin mit Schwerpunkt Wirtschaft. Sie absolvierte ihr Studium der Journalistik und Betriebswirtschaft an der Universität Stuttgart und hat seitdem für mehrere renommierte Medienhäuser gearbeitet. Sophie ist Mitglied in der Deutschen Fachjournalisten-Assoziation und wurde für ihre eingehende Recherche und klare Sprache mehrmals ausgezeichnet. Ihre Artikel decken ein breites Spektrum an Themen ab, von der lokalen Wirtschaftsentwicklung bis hin zu globalen Finanztrends. Wenn sie nicht gerade schreibt oder recherchiert, genießt Sophie die vielfältigen kulturellen Angebote Stuttgarts und ist eine begeisterte Wanderin im Schwäbischen Wald.

Ähnliche Artikel

Schreibe einen Kommentar

Deine E-Mail-Adresse wird nicht veröffentlicht. Erforderliche Felder sind mit * markiert

Schaltfläche "Zurück zum Anfang"