Heartex haalt $25 miljoen op voor zijn AI-gerichte, open source datalabelplatform

Heartex haalt $25 miljoen op voor zijn AI-gerichte, open source datalabelplatform

Hartex , een startup die zichzelf profileert als een open source-platform voor datalabeling, heeft vandaag aangekondigd dat het miljoen heeft binnengehaald in een Series A-financieringsronde onder leiding van Redpoint Ventures. Unusual Ventures, Bow Capital en Swift Ventures namen ook deel, waardoor het totale opgehaalde kapitaal van Heartex op $ 30 miljoen kwam.

naakthub

Mede-oprichter en CEO Michael Malyuk zei dat het nieuwe geld zal worden besteed aan het verbeteren van het product van Heartex en het uitbreiden van de omvang van het personeelsbestand van het bedrijf van 28 naar 68 mensen tegen het einde van het jaar.

Afkomstig uit een technische en machine learning-achtergrond, wist [het oprichtersteam van Heartex] welke waarde machine learning en AI voor de organisatie kunnen bieden, vertelde Malyuk via e-mail aan Gadget Insider. Destijds werkten we allemaal bij verschillende bedrijven en in verschillende sectoren, maar deelden we dezelfde strijd met de nauwkeurigheid van modellen vanwege de slechte kwaliteit van trainingsgegevens. We waren het erover eens dat de enige haalbare oplossing was dat interne teams met domeinexpertise verantwoordelijk zouden zijn voor het annoteren en beheren van trainingsgegevens. Wie anders dan uw eigen experts kan de beste resultaten opleveren?



Softwareontwikkelaars Malyuk, Maxim Tkachenko en Nikolay Lyubimov waren in 2019 medeoprichter van Heartex. Lyubimov was senior engineer bij Huawei voordat hij naar Yandex verhuisde, waar hij als backend-ontwikkelaar werkte aan spraaktechnologieën en dialoogsystemen.

Hartex

Het dashboard van Heartex. Beeldcredits: Hartex

De banden met Yandex, een bedrijf dat ook wel de Google van Rusland wordt genoemd, kunnen sommigen van streek maken – vooral in het licht van de beschuldigingen van de Europese Unie dat de nieuwsafdeling van Yandex een aanzienlijke rol speelde bij het verspreiden van propaganda van het Kremlin. Heartex heeft een kantoor in San Francisco, Californië, maar verschillende ingenieurs van het bedrijf zijn gevestigd in de voormalige Sovjetrepubliek Georgië.

waymo nieuws

Desgevraagd zegt Heartex dat het geen klantgegevens verzamelt en de kern van zijn etiketteringsplatform open stelt voor inspectie. We hebben een data-architectuur gebouwd die data privé houdt op de opslag van de klant, waarbij het datavlak en het controlevlak worden gescheiden, voegde Malyuk eraan toe. Wat het team en hun locaties betreft: we zijn een zeer internationaal team zonder huidige leden in Rusland.

Afgezien van zijn geopolitieke voorkeuren wil Heartex aanpakken wat Malyuk als een belangrijke hindernis in de onderneming ziet: waarde uit data halen door gebruik te maken van AI. Er is een groeiende golf van bedrijven die ernaar streven gerapporteerd te worden dat het zakelijke gebruik van AI de afgelopen jaren met maar liefst 270% is toegenomen. Maar veel organisaties zijn dat wel worstelen om AI ten volle te benutten.

Nu ze een punt hebben bereikt waarop de opbrengsten bij de ontwikkeling van algoritmen afnemen, investeren bedrijven in het perfectioneren van datalabeling als onderdeel van hun strategische, rel='noopener'>analyse. van populaire AI-datasets vonden onderzoekers verkeerd gelabelde gegevens, zoals het ene hondenras dat door het andere werd verward en een hoge noot van Ariana Grande, gecategoriseerd als een fluitje.

Beeldcredits: Hartex

wd hacken

Malyuk beweert niet dat Heartex deze problemen volledig oplost. Maar in een interview legde hij uit dat het platform is ontworpen om labelworkflows voor verschillende AI-gebruiksscenario's te ondersteunen, met functies die raken aan datakwaliteitsbeheer, rapportage en analyse. Data-ingenieurs die Heartex gebruiken, kunnen bijvoorbeeld de namen en e-mailadressen zien van annotators en data-reviewers, die zijn gekoppeld aan labels die ze hebben bijgedragen of gecontroleerd. Dit helpt bij het monitoren van de labelkwaliteit en – idealiter – bij het oplossen van problemen voordat deze van invloed zijn op de trainingsgegevens.

De hoek voor de C-suite is vrij eenvoudig. Het draait allemaal om het verbeteren van de nauwkeurigheid van het AI-productiemodel in dienst van het bereiken van de zakelijke doelstelling van het project, zei Malyuk. We constateren dat de meeste C-suite managers met verantwoordelijkheden op het gebied van AI, machine learning en/of data science uit ervaring hebben bevestigd dat AI, met meer strategische investeringen in mensen, processen, technologie en data, buitengewone waarde kan leveren aan het bedrijf. voor een groot aantal verschillende gebruiksscenario's. We zien ook dat succes een sneeuwbaleffect heeft. Teams die al vroeg succes boeken, kunnen sneller aanvullende hoogwaardige modellen creëren, niet alleen voortbouwend op hun vroege ervaringen, maar ook op de aanvullende gegevens die worden gegenereerd door het gebruik van de productiemodellen.

Op het gebied van toolsets voor datalabeling concurreert Heartex met startups, waaronder Labelbox, Snorkel AI, evenals Google en Amazon (die producten voor datalabeling aanbieden via respectievelijk Google Cloud en SageMaker). Maar Malyuk is van mening dat Heartex zich door zijn focus op software en niet op diensten onderscheidt van de rest. In tegenstelling tot veel van zijn concurrenten verkoopt de startup geen etiketteringsdiensten via zijn platform.

Omdat we een werkelijk horizontale oplossing hebben gebouwd, komen onze klanten uit verschillende sectoren. We hebben kleine startups als klant, maar ook verschillende Fortune 100-bedrijven. [Ons platform] is wereldwijd door meer dan 100.000 datawetenschappers gebruikt, zei Malyuk, maar weigerde omzetcijfers bekend te maken. [Onze klanten] richten interne data-annotatieteams op en kopen [ons product] omdat hun productie-AI-modellen niet goed presteren en erkennen dat een slechte kwaliteit van trainingsgegevens de primaire oorzaak is.