ML är redan i hög grad en del av de flesta människors liv, men vi vet kanske inte om det. Om man regelbundet surfar på nätet, eller mer specifikt – handlar från en särskild sajt – så är sannolikheten stor att olika system för ML ligger bakom vilka erbjudanden som visas. På samma sätt använder många organisationer ML-teknik för att lyssna av vad som sägs om organisation och dess varumärken på sociala medier, särskilt i kombination med olika sätt att automatiskt värdera exempelvis kunders omdömen – om de är positiva eller negativa och hur de kopplas till olika produkter och tjänster.

Nyckelordet här är ”automatiskt”. I princip kan ML automatisera utvecklandet av system som själv hela tiden lär sig att hitta nya mönster, samband och fakta i data – och nästan automatiskt skapa olika sätt att svara och agera på dessa mönster och fakta.

ML finns alltså i högsta grad i system som många människor använder varje dag, och de många gånger beräkningsintensiva algoritmerna bakom dessa system har funnits i flera årtionden. Så i sig är ML inte nytt. Det som är nytt är den kontext som snabbt växt upp runt alla människor likväl som företag. Ökade datamängder (Big Data och Internet of Things), i princip obegränsade möjligheter till datalagring och beräkningskraft (Cloud) samt en gemensam infrastruktur för alla människor, organisationer och företag (Internet och sociala medier) gör att ML plötsligt framstår som ett ganska självklart verktyg för allt fler uppgifter.

Den snabba tekniska utvecklingen enligt ovan gör att man med hjälp av ML kan ­accelerera en organisations möjligheter att upptäcka och utvärdera nya mönster och samband många gånger om. Allt fler organisationer upptäcker vilken enorm nytta man kan ha av ML. Här är några exempel:

  • Identifiera vilka tumörer som är elakartade och vilka som är ofarliga.
  • Identifiera de områden där det är mest sannolikt att hitta illegal jakt på elefanter (och elfenben).
  • Ge patrullerande poliser i New York realtidsvarningar om potentiella hot i de områden de befinner sig i.
  • Ersätta ”statisk” identifiering med exempelvis lösenord och pinkoder med röst- och/eller ansiktsigenkänning.

Ett av de mest intressanta områdena för ML är riskhantering och bedrägeribekämpning. Prediktiva modeller har länge använts för att identifiera bedrägerier ”innan de begås”. Det innebär att man givet historiska data bedömer hur olika beteenden kan indikera att ett bedrägeriförsök är på väg att genomföras. Kunnandet om detta är förstås störst inom branscher som bank och finans liksom inom försäkring, där man under lång tid finslipat system som ger tidiga varningar om att otrevliga händelser planeras.

Deep Learning
Med ML kan man ta bedrägeribekämpning mycket längre. Man kan exempelvis låta systemen själva upptäcka de beteenden som indikerar bedrägeri. Då används ofta en ML-teknik som kallas för Deep Learning, som är en typ av djupa komplexa neurala nätverk.

Paypal, tjänsten som används för säkra betalningar mellan privatpersoner, har använt ML för att hantera bedrägeriförsök under lång tid och har nu flera olika ML-strategier på plats. Varför flera olika? För att olika system passar olika bra för olika typer av problem och en del problem kräver en kombination av flera strategier. De allra mest avancerade ML-systemen kan identifiera tidigare okända typer av bedrägeriförsök. Men de kräver också betydligt mer data, mer datorkraft och – inte minst – betydligt mer kunskap om hur man utformar dem.

Man kan träna upp ett neuralt nätverk att identifiera olika händelsekedjor som man vet har lett till bedrägeriförsök. Det neurala nätverket kan sedan användas för att identifiera liknande mönster i ”ny” data – alltså exempelvis i transaktioner som exekverats från konton som systemet inte tidigare utsatts för. Det neurala nätverket ”lär sig” genom träning och kan generalisera en bit utifrån de träningsdata det utsatts för. Man skulle exempelvis kunna träna ett nätverk att skilja ut bilder på män från bilder på kvinnor och sedan med ganska hög sannolikhet kunna könskategorisera bilder på människor som det neutrala nätverket inte tidigare sett. Det är detta som är själva poängen med ML och neurala nätverk – att hitta mönster och fatta beslut baserat på tidigare okänd data.

Modellera komplexa samband
Neurala nätverk har en förmåga att modellera komplexa samband, genom att härma en människas sätt att processa information. Deep Learning är ett än mer komplext och kraftfullt specialfall av neurala nätverk.

Betalföretaget Paypal har använt ML för att upptäcka bedrägeriförsök i flera år. Hui Wang är ansvarig för Paypals riskhantering och förklarade på ett lättillgängligt sätt nyligen för tidningen Infoworld hur ”Deep Learning” skiljer sig från neurala nätverk:

”Med Deep Learning tittar systemen på många fler features, som variabler kallas på ML-språk, och på data av många olika slag. Istället för att titta på en handfull olika sorters händelser – som vem som initierat en transaktion, när det skett, vad vederbörande gjort tidigare et cetera – så kommer systemen baserade på Deep Learning generera och baseras på flera tusen features och därmed enormt mycket mer data.”

Den iterativa biten av lärande algoritmer som Deep Learning gör att de generaliserar och anpassar sig bra, samt lär sig mer och mer allt eftersom ny data introduceras. ML-tekniker är oftast väldigt träffsäkra och används med fördel då förmågan att prediktera precist är viktigare än att kunna förklara själva modellen. De många gånger tusentals olika komplexa variablerna som genereras gör att själva modellen i sig blir en black-box som många gånger är omöjlig att förklara för beslutsfattare. Detta gör att de fortfarande har begränsningar inom reglerade branscher där man måste kunna förklara hur man ­kommit fram till ett visst beslut.

170 miljoner användare
Paypal har över 170 miljoner användare som genererar en mängd transaktionsdata. Systemen som används för Deep Learning använder dessutom data som inte direkt genereras av användarna – allmän finansiell data, data om nätverksaktiviteter och vilka datorer och andra enheter som är uppkopplade, samt en mängd annan information som är relativt enkel att komma åt genom exempelvis Google Analytics.

Det uppkopplade samhället ger alltså stora möjligheter för Deep Learning. Men det är också detta som skapat en del oro – kända personer som Microsofts Bill Gates, Teslas grundare Elon Musk och fysikern Stephen Hawking har varnat för att avancerade system för Deep Learning skulle kunna löpa amok och i någon mening hota människor och företag. De pekar på två saker. För det första att system för Deep Learning ju lär sig själva – de utsätts för mängder av data och hittar sedan själv mönster. För det andra så kan system för Deep Learning – om de är utformade på ett visst sätt – också agera på de mönster som hittas. Kritiker har hävdat att system för Deep Learning i teorin skulle kunna upptäcka nya terrorhot – vilket skulle vara bra – men att de också skulle kunna sätta igång insatser mot dessa potentiella hot utan att någon människa skulle vara inblandad i beslutsprocessen. Så vad händer om systemet har fel om terrorhotet? Skulle det kunna sätta igång ett nytt världskrig?

New York

Att frågan överhuvudtaget kommer upp indikerar vilken kraft som finns i de mest avancerade systemen för ML. I praktiken torde risken vara mycket liten.

Enorm potential
Det finns dock en enorm potential i system som inte bara själv lär sig – som Deep Learning – utan som också, inom rimliga gränser, själv agerar på de insikter systemen bygger upp. Ett system för riskhantering byggt på Deep Learning skulle exempelvis inte bara kunna upptäcka nya sorters bedrägeriförsök – utan också automatiskt avbryta misstänkta bedrägerier. Samma typ av system används redan i så kallad robothandel med värde­papper – systemen identifierar trender i enormt stora datamängder och agerar (säljer eller köper) automatiskt.

Det finns modellstyrd analys och datadriven. ML hör till den senare kategorin. Det finns system för ML med olika uttryckskraft, men gemensamt för dem alla är att de är drivna av data. De enklare systemen ”tränas” genom data, som matchas med kända utfall. De mer avancerade systemen hittar själva de mönster som är relevanta.

Så om man nu vill starta en ML-satsning – hur bär man sig åt? I de flesta fall så står man inför minst två stora utmaningar – organisation och data. Man måste ha kunskap i sin organisation, både om hur ML fungerar och om de problem som ML ska lösa. Dessutom så måste man ha kunskap om data som ska användas för att ”sätta upp” systemen, alltså data som ska användas för att ge organisationen nya kunskaper. Slutligen måste man ha tillgång till data. Massor av data. Big Data!

Detta är inga små utmaningar. I gengäld visar sig ML ge organisationer fantastisk utväxling. I bästa fall bygger man faktiskt in intelligens i själva organisationen.