Nå kan læreren finne ut om du har skrevet stilen eller ikke. Foto: Flickr-bruker ccarlstead, Creative Commons
Nå kan læreren finne ut om du har skrevet stilen eller ikke. Foto: Flickr-bruker ccarlstead, Creative CommonsVis mer

Lærernes farligste våpen

Nå blir du nødt til å skrive stilene selv.

Visste du at over 90% av all epost som sendes er spam?

Heldigvis slipper de fleste av oss unna langt billigere, fordi epostserveren har et innebygd spamfilter som tar bort det aller meste.

De fleste spamfiltre trenes opp med tiden. Hver innkommende epost analyseres for deretter å bli klassifisert som spam eller "ekte", der den slipper igjennom i det siste tilfellet. Kriteriene er flere - forekomster av enkelte ord (Viagra er en klassiker), avsenderadresse, setningsoppbygging, tegnsetting etc. er alle kriterier som blir lagt til grunn, i hvert fall blant de markedsledende spamfilterne.

Slik slipper du spam

Tjenesten uClassify lar deg klassifisere tekst. Ved å trene opp denne tjenesten kan du etter hvert med stor nøyaktighet avsløre egenskaper ved teksten du mater inn.

Dette lar seg selvsagt forklare mye bedre med et eksempel:

Har Bjørn Eirik eller Pål Joakim skrevet teksten?

Vi bestemte oss for å prøve tjenesten på en enkel måte - ved å trene den med fem artikler fra undertegnede og fem fra Bjørn Eirik (DinSides dataredaktør), ville vi se i hvilken grad uClassify klarte å gjette riktig når vi gav den artikkel der vi ikke angav hvem som hadde skrevet den.

Resultatet var oppsiktsvekkende - i alle tilfeller bortsett fra ett rapporterte uClassify at det var over 80% sannsynlig at den av oss som hadde skrevet den faktisk hadde gjort det. Det eneste den bommet på var Sykkelbloggen, men vi er ganske sikre på at den ville ha gjettet riktig om vi hadde trent den opp med 100 artikler i stedet for 5. Dette kan for eksempel ha sin enkle forklaring i at undertegnede ofte bruker jeg-form i artiklene, og at dette parameteret ble utslagsgivende på grunn av få artikler i treningsprogrammet.

Lyst til å se hvor enkelt det gjøres? I fotoalbumet under viser vi deg hvor enkelt du gjør det (de forklarende tekstene har dessverre en tendens til å komme et stykke under selve bildet). Vi har valgt å bruke webløsningen, men det finnes også et API for deg som har lyst til å programmere mot uClassify og lage noen morsomme varianter.

Først må du registrere deg for å bruke tjenesten.
Opprett din første classifier - vi har kalt vår "hvem skrev hva", men du kan lage andre varianter, f.eks. spam eller ikke, gutt eller jente, glad eller trist e.l.
Opprett klassene du vil bruke - i vårt tilfelle opprettet vi en for Bjørn Eirik og en for Pål Joakim.
Tren opp hver klasse. Vi tok fem tilfeldige artikler fra Bjørn Eirik og limte inn i tekstfeltet (uten "Av Bjørn Eirik Loftås", selvsagt). Hvis du gjør en bommert kan du velge untrain og lime inn den samme teksten, så blir den borte.
Når du har trent opp alle klassene dine, går du til classifier og limer inn teksten du vil sjekke ut. I vårt tilfelle har vi limt inn teksten du har lest i denne artikkelen, og som du ser gjetter uClassify helt riktig!


For å oppfylle tittelen og ingressen i denne saken skjønner du sikkert hvor dette bærer - lærere kan lett trene opp uClassify ved å mate inn stiloppgaver og angi hvem som har skrevet dem, og dermed kan man også raskt avsløre det dersom du plutselig har fått noen andre til å skrive stiloppgaven for deg.

Ikke vis denne til læreren heller

Mange har laget morsomme varianter rundt denne tjenesten. Ett eksempel er http://www.bloggparti.se/, der du kan taste inn URL-en til en svensk blogg og få ut en sannsynlighetsvurdering av hvilket parti vedkommende stemmer på. Skaperen har trent opp uClassify basert på de 100 mest populære bloggene fra hvert parti. En annen variant er denne, som finner ut hvilket språk en gitt tekst er på.

Og forresten - uClassify mener at det er over 80% sannsynlig at jeg har skrevet denne artikkelen.

URL: http://www.uclassify.com/

Artikkelbildet er tatt av Flickr-bruker ccarlstead og lisensiert under Creative Commons