Litt om algoritmer, kunstig intelligens, maskinlæring og nevrale nettverk



Dette er en serie av artikler hvor jeg ønsker å dele mine observasjoner og tanker innenfor områdene kunstig intelligens, maskinlæring, deling av data og litt annen snacks. Mitt utgangspunkt er fra novise til amatør. Dette er betraktninger gjort fra en som hverken er ekspert eller håndterer tema til daglig, og vil forhåpentlig bidra til både å forenkle og å avmystifisere begreper og områder i en ellers så kompleks setting. Serien er delt inn i følgende artikler:


  • Litt om algoritmer, kunstig intelligens, maskinlæring og nevrale nettverk

  • Kunstig intelligens, data og “storebror ser deg” tilstander

  • Kunstig intelligens - et redskap for Fake News

  • Kunstig intelligens - historiske feil

  • Bærekraftig vekst med kunstig intelligens

  • Digital fremtid - en fordel for arbeidsmarkedet?


Først og fremst - noen begrepsavklaringer


Algoritmer

For de som ikke vet hva en algoritme er, så skal jeg forsøke meg på en liten og veldig enkel forklaring. En algoritme er rett og slett en logisk prosedyre eller en prosess lagt til rette for å kunne løse et problem. Veldig forenklet kan det sidestilles med en bruksanvisning som steg for steg forklarer deg hvordan du skal komme til et sluttresultat. Litt som å sammenligne dette med en IKEA monteringsanvisning som viser deg steg for steg hvordan du skal komme til målet (sluttproduktet). Et annet eksempel er det å følge en kakeoppskrifter eller det å gå på jobben. Dette er to former for algoritmer. Når du går til jobben, velger du en retning og tar et skritt, så velger du retning og tar et skritt til. Dette blir repetert helt til du kommer dit du skal. Samme med en oppskrift. Du følger den steg for steg frem til kaken er klar. Du benytter systematisk kunnskap, altså oppskriften - eller algoritmen - for å løse en oppgave.


Kunstig intelligens

Alle programmer er bygd opp av en rekke algoritmer, det gjelder også applikasjoner og løsninger som er bygget ut fra og benytter seg av kunstig intelligens. Kunstig intelligens blir gjerne definert som informasjonsteknologi som justerer og tilpasser sin egen aktivitet og vil tilsynelatende fremstå som intelligent. Man sier gjerne - veldig forenklet - at kunstig intelligens er i stand til å løse oppgaver uten å få instruksjoner fra et menneske. Et eksempel som gjerne brukes, er såkalte “Intelligente” søkemotorer. De gjør søk og treff basert på grunnlag av data om tidligere søk, brukeradferd, din profil og annet relevant informasjon eller valg. Dette igjen kalles igjen maskinlæring.



Maskinlæring

Maskinlæring er i all hovedsak en læringsteknikk for kunstig intelligens. Et hovedfokus innen forskning på maskinlæring, er å automatisere læring og gjenkjenning av komplekse mønstre og gjøre såkalte intelligente beslutninger basert på en mengde data. En lærings algoritme gjør bruk av ett sett med treningsdata for å kunne utvikle eller forbedre en gitt atferd. Kvalitet og utfall av maskinlæring er proporsjonal med mengde treningsdata.


Nevralt nettverk

Maskinlæring og kunstig intelligens bruker ofte nevrale nettverk for læring. Et nevralt nettverk er en organisering og oppbygging av datastrukturer og algoritmer inspirert av måten nervecellene i en hjerne er organisert på. Nevrale nettverk og strukturer er veldig godt egnet til å kunne kartlegge og identifisere sammenhenger hvor det er vanskelig å se klare matematiske og logiske sammenhenger. Brukes ofte ved bilde- og talegjenkjenning, men også for å kunne klassifisere mennesker ut fra handlingsmønstre.



Utfordringer knyttet til KI og ML

Maskinlærings algoritmer krever enorme mengder av lagret data og data for å kunne trene. Det å lage gode KI systemer krever trening - mye trening. Det betyr enorme mengder data. Eksempelvis vil det å kjøre kontrollert læring - eksempelvis gjenkjenne personer og objekter i ulike settinger og variasjoner kreve enorme mengder tilgjengelig data for å kunne levere noenlunde kvalitet. Liten dreining i ønsket bruk eller intensjon vil igjen kreve ytterligere mengder med data.


Kontrollert maskinlæring bruker nevrale nettverk som fundament for kunstig intelligens. En slik modell gjør bruk av predefinerte attributter fra historiske data. Merking av data er ganske enkelt prosessen for å rydde og organisere rådata for at de kan brukes i en kognitiv setting for maskiner. Dyp læring krever mengder av merkede data. Selv om merking og kategorisering ikke er “rocket science”, så er det fortsatt både en krevende og kompleks oppgave som må gjøres. Kunstig intelligens kan bare utføre oppgaver og ta beslutninger som er i tråd med miljøet og rammene det er skapt for. Det å skaffe til veie og katalogisere data er en prosess som en god del manuell jobb, og er en svært tidkrevende prosess.

I takt med at kunstig intelligens og maskinlærings algoritmer blir implementert, vil det kunne oppstå skjevheter og feil i underlaget og datagrunnlaget. I noen tilfeller - hvor det tilsynelatende ser bra ut, vil det kunne være støy og en del irregulariteter i data. Kvalitet og pålitelighet i KI er avhengig av hva som blir matet inn. Eksempelvis vil manglende variasjoner i underlag og data, samt variasjoner i miljø, omgivelser og fysikk, kunne gi feil resultat identifisering av objekt eller f.eks. ansiktsgjenkjenning. Det betyr at variasjon i data, men også variasjon i datakilder er viktig for å øke kvaliteten.



Modeller for kunstig intelligens mangler evnen til å fange opp og tolke variasjoner fra det som ble matet inn under trening. I utgangspunktet er det rett og slett vanskelig å overføre en modell og erfaring fra ett scenario til et annet. Det betyr at modell som er tilrettelagt og lagd for et bestemt use-case vanskelig kan gjenbrukes i en annet. Konsekvensen av det er at man i tillegg til å bruke mye ressurser for å både tune, trimme og utvikle modellene som brukes, fortsatt må bruke tilsvarende mye ressurser på å lage og trene opp modeller som man i utgangspunktet skulle ha trodd var bare å gjenbruke.


Kort oppsummert

Kunstig intelligens er fortsatt i enorm utvikling, og langt fra så moden og så intelligent som mange tilsynelatende skal ha det til å være. For de som har sett Terminator - “Skynet” scenarioet er fortsatt veldig, veldig langt unna. Jeg sover veldig godt om natten og er ikke - så langt veldig bekymret om kunstig intelligens kan utfordre oss mennesker intellektuelt. Men - det er noen området som er verdt å være litt obs på.


Om forfatteren

Richard Johnsen er seniorkonsulent og partner i Cloudberries. Han har mer enn 20 års erfaring fra med å håndtere komplekse og virksomhetskritiske IT-prosjekter og programmer. Han har bred erfaring fra ulike roller både som rådgiver, prosjektleder, testleder og leder i ulike bransjer. Richard ønsker ikke å titulere seg selv som innovasjonsekspert, men heller en som er veldig nysgjerrig på både begrep og metoder, og har et stort engasjement for å lære mer.


Ta kontakt med Richard for å høre hvordan Cloudberries kan hjelpe organisasjonen din til å komme i gang med innovasjon: richard.johnsen@cloudberries.no.


Org. nr. 921957319

Tel. +47 90 84 84 32

Besøksadresse: Arbins gate 2, 0253 Oslo
Postadresse: Postboks 115, 2027 Kjeller 

©2019 by Cloudberries AS.