Göm menyn

Igenkänning för seende robotar

object collage
Att känna igen föremål baserat på deras utseende är enkelt för de flesta människor. För en robot är däremot seendet en komplex process som behöver byggas upp från grunden. Det är hur man gör detta, som jag och min forskargrupp studerar.
Under de senaste tio åren har det skett en stadig förbättring av datorseende för objektigenkänning. Genom att förse ett objektigenkänningssystem med ett antal exempel på ett objekts utseende kan det tränas till att känna igen objektet från godtyckliga vyer. Datorseende är dock inte ännu lika bra som människans seende, och en möjlig orsak till detta är att datorseende vanligtvis är en passiv process, medan människans seende är aktivt. Objektigenkänningssystem testas vanligtvis genom att de förses med en bild, och sedan beräknas vilket eller vilka objekt som finns i bilden. En människa däremot har möjlighet att se föremål med både vänster och höger öga, kan flytta blicken och till och med flytta sig själv eller föremålet för att kunna betrakta det från en annan, bättre vy.

 

Eddie the embodied
Det här projektet syftar till att vidareutveckla datorseendealgoritmer för objektigenkänning genom att göra dem aktiva, på samma sätt som människans synsinne är aktivt. Vi utvecklar datorseendealgoritmer på ett robothuvud med djupseende (via två kameror), detaljseende (den centrala delen av synfältet är högupplöst), samt ett vrid- och tippbart huvud. Så småningom kommer vi lägga till möjligheten att förflytta sig i sidled. Huvudet är dessutom utrustat med högtalare och talsyntes och kan ge kommandon via röstmeddelanden. Samtliga komponenter hos roboten kommer användas för att göra både inlärning och seende till aktiva processer, där roboten flyttar blicken mellan olika särdrag, men också kan be en assisterande person om hjälp att flytta på, eller vrida de föremål den betraktar.

Robotar med visuell igenkänningsförmåga har många möjliga användningsområden. Huvudmotiveringen är att man kan instruera en seende robot med kommandon som exempelvis "ge mig den vita kaffekoppen som står bredvid tangentbordet". Utan igenkänning av föremålen "kaffekopp" och "tangentbord" går detta inte. Andra användningsområden är intelligenta rullstolar som kan navigera och undvika kollisioner, terapileksaker som används vid behandling av autistiska barn, och behandling av barn med anknytningsproblem. Vidare möjliggör seende på sikt robotbetjänter, och robotar som ger guidade turer, t.ex. på museer. Alla dessa användnigsområden kräver ett synsinne som är snabbt, tillförlitligt, och som har förmågan att anpassa sig över tiden. Detta är precis vad det här projektet undersöker.

 

Den 10e maj sändes ett inslag om Eddie i Östnytt. Klicka här för att se inslaget.

 


 

På de engelska sidorna ges en mer utförlig presentation av forskningsområdet. Du når dem genom länken här nedanför.

Presentation in English

 

Photo of Per-Erik Forssén
Namn: Per-Erik Forssén
Titel: Universitetslektor
Avdelning: Inst. för systemteknik


KONTAkT

Tel: +46 13 285654
Fax: +46 13 ---
E-mail: perfo at isy.liu.se

Adress:
Institutionen för systemteknik
Linköpings universitet
SE – 581 83 Linköping
Sverige


Sidansvarig: per-erik.forssen@liu.se
Senast uppdaterad: Mon May 27 10:42:45 CEST 2013