Hoe Amazon het gat in de gegevenswetenschap wil overbruggen door machine learning naar de cloud te brengen

Bedrijven zoeken steeds vaker naar manieren om hun bedrijfsresultaten te verbeteren door de verzamelde gegevens te minen.

Maar het is moeilijk voor bedrijven om zinvolle informatie te extraheren wanneer gegevenswetenschappers schaars zijn.

Als reactie op dit tekort aan vaardigheden hebben grote cloudproviders on-demand services opgezet om bedrijven de kans te geven aan de slag te gaan met machine learning.

Machine learning is een techniek waarmee computers naar patronen in gegevens kunnen zoeken en die de online aanbevelingsengines aanstuurt die boeken of films suggereren die u misschien leuk vindt. Bedrijven kunnen modellen van machine learning gebruiken om nuttige voorspellingen te doen: zoals 'Is this email spam?' of 'Hoeveel items worden naar verwachting in deze regio verkocht?'

AWS algemeen manager voor gegevenswetenschap Matt Wood Afbeelding: Amazon

Amazon, Microsoft en Google bieden on-demand machine learning-diensten via hun respectieve cloudplatforms, elk met verschillende niveaus van toegankelijkheid voor ontwikkelaars zonder een achtergrond in statistieken.

Amazon gebruikt machine learning al sinds de begindagen als online boekverkoper, toen het een manier nodig had om zijn menselijke redacteuren te helpen bij het kiezen van aanbevelingen uit zijn één miljoen sterke bibliotheek.

"We besloten al heel vroeg als organisatie dat machine learning belangrijk zou worden naarmate ons bedrijf groeide", zegt Matt Wood, algemeen manager voor data science bij Amazon Web Services (AWS).

"We hadden een beslissing moeten nemen. Willen we een hele hoop experts en specialisten op het gebied van machine learning inhuren als die jongens en meisjes heel zeldzaam zijn? Dat is een zeer ijle mix van statistische vaardigheden, van kruisvalidatie, van algoritme ontwerp. "

In plaats daarvan besloot Amazon om een ​​relatief kleine groep van machine learning-experts in te huren om een ​​interne service te bouwen die door alle ontwikkelaars kon worden gebruikt.

"We zagen deze flair van innovatie omdat ontwikkelaars niet heel veel tijd hoefden te steken in het leren van machines om de voordelen ervan te kunnen gebruiken, " zei hij, onder verwijzing naar de rol van de dienst op gebieden zoals uitvoering, capaciteit planning, supply chain management en identificatie van namaakgoederen.

De openbare machine learning-service die vandaag door AWS wordt aangeboden, is gebaseerd op dezelfde algoritmen die het bedrijf intern aan zijn personeel ter beschikking stelt. Klanten kunnen modellen voor machinaal leren bouwen met behulp van gegevens die zijn opgeslagen in Amazon's Relational Data Service met een MySQL-back-end, de S3-objectopslag of de Redshift-gegevensopslagservice om ze te trainen.

Deze modellen kunnen worden gebruikt om verschillende soorten voorspellingen te doen. Binaire classificatie wordt gebruikt om een ​​van de twee mogelijke resultaten te voorspellen - 'Is dit e-mail spam of niet?'. Classificatie in meerdere klassen om een ​​van de drie of meer mogelijke uitkomsten en de waarschijnlijkheid van elke uitkomst te voorspellen - 'Is dit product een boek, een film of een kledingstuk?'. Regressie wordt gebruikt om een ​​getal te voorspellen - 'Wat is de temperatuur waarschijnlijk morgen?'.

De service zal ook proberen de gegevens automatisch te valideren en, waar mogelijk, om te zetten in een nuttiger vorm, bijvoorbeeld door de postcode of postcode uit een adres te extraheren.

Zodra het model is gebouwd, hebben ontwikkelaars er toegang toe via de AWS-console of API-aanroepen, waardoor de voorspellingen kunnen worden ingevoerd in een app of online service. Modellen kunnen worden verfijnd met behulp van schuifregelaars in de console.

"De ontwikkelaar moet heel, heel weinig weten over machine learning. De machine learning karbonades worden beheerd door de service, " zei Wood.

Cloud-gebaseerde diensten zoals deze verminderen de moeilijkheid om te experimenteren met machine learning, waardoor de tijd en het geld die nodig zijn om de vaardigheden te leren om aan de slag te gaan, worden verminderd, zei hij.

Amazon testte hoeveel gemakkelijker de service het voor ontwikkelaars maakte om aan de slag te gaan met machine learning, waarbij twee ontwikkelaars zonder een machine learning-achtergrond de opdracht kregen om een ​​model te bouwen voor het voorspellen van het geslacht van een persoon vanaf hun voornaam.

Het kostte de ontwikkelaars een maand om hun model te bouwen, dat werd getraind met behulp van volkstellingen en het geslacht voorspelde met een nauwkeurigheid van 92 procent. Daarentegen kostte het een ontwikkelaar zonder kennis van machinaal leren 20 minuten om hetzelfde model met dezelfde voorspellingsnauwkeurigheid te bouwen met behulp van de service van Amazon.

Dat wil niet zeggen dat deze cloudservices geschikt zijn voor ieders behoefte aan machine learning.

Ten eerste, hoewel ze de startkosten kunnen verlagen, kunnen ze op de lange termijn duur zijn om te gebruiken. De service van Amazon kan ongeveer $ 100 per miljoen voorspellingen kosten.

Zoals een ondernemer zei: "Dit zou erg leuk zijn om te gebruiken bij mijn startup, maar het is zelfs tegen een zeer groot budget onbetaalbaar."

De service heeft ook kritiek geuit voor het vergrendelen van gebruikers, waarbij de service gebruikers niet toestaat om modellen te exporteren en importeren.

"Ik zie niet hoe elk bedrijf met een likje zintuigen hun voorspellingsmodel zou kunnen opsluiten in AWS", zoals een gebruiker op het ontwikkelaarsforum van Hacker News zei.

Ondanks deze kritiek op de nog steeds jonge service, denkt Wood dat dit zal leiden tot meer experimenten met machine learning bij bedrijven die voorheen niet wisten waar ze moesten beginnen.

"De sleutel voor mij is productiviteit en ervoor zorgen dat ontwikkelaars hier toegang toe hebben."

© Copyright 2020 | mobilegn.com