Vad är API för bildigenkänning, och vad kan de göra för dig? Denna artikel kommer att rensa upp vilket bildigenkänning som är, vilket API gör, och hur det kan hjälpa dig eller ditt företag att få mer ut av internet. Bildigenkänning har stor potential för företag och för enskilda synskadade internetanvändare.
Vad är ett bildigenkännings API?
Bildigenkänning är där en bit av programvara upptäcker egenskaperna hos en bild och kategoriserar det korrekt. Om du till exempel laddar upp en bild av en Ferrari 458 till ett bildigenkännings-API, bör det känna igen att det är en bil och att den är (eller borde vara) röd. Beroende på API kan ytterligare klassificering vara möjlig beroende på vilken bild du använder.
Det här kan verka väldigt enkelt - människor kan titta på en bild och berätta vad det är en bild av utan att prova, mestadels men det har varit ett svårt problem att lära datorn att lösa. Mycket arbete har gått ut på hur en dator kan förstå hur sakerna ser ut, och vi har gjort stora framsteg, från möjligheten att göra omvänd bildsökning till Googles berömda Deep Dream-nätverk.
Ett API är ett Application Program Interface. Det är i huvudsak en mellanhand mellan programrutiner som berättar ett element hur man arbetar med en annan, eller ger de verktyg de behöver för att utföra en funktion. Det finns dussintals typer av API som kan uppnå alla möjliga mål, med hjälp av en rad programmeringsspråk. I det här sammanhanget är ett bildigenkännings API det verktyg du kan använda för att komma åt den djupa inlärningskraften hos några kommersiella bildigenkänningssystem.
Du behöver mycket datorkraft för att utföra bildigenkänning. Du behöver massor av data och makt att tolka allt. De flesta användare har helt enkelt inte de massiva resurserna för att bygga sin egen djupa inlärningsmaskin. Större namn som Googles Vision API, Microsofts Face API, ImageNet och andra har sådana maskiner och tillåter åtkomst till dem via API, antingen gratis eller mot avgift. Detta gör det möjligt för företag av alla storlekar att få tillgång till den här strömmen och användare får nya erfarenheter som resultat.
Hur går bildigenkänning att förändra vår internetupplevelse?
Olika internetanvändare kommer att få olika fördelar med bildigenkänning. Låt oss titta på en hypotetisk webbplatsägare och en hypotetisk användare för att se hur båda sidorna kan gynna.
Företagets fördelar med bildigenkänning
Till exempel, låt oss säga att du driver en självförsäljningsportal som liknar Etsy eller en datingwebbplats. Du vill hantera kvaliteten och lämpligheten för alla bilder som laddas upp av användare. Du vill blockera alla vuxna eller olämpliga bilder och sortera dem i lämpliga kategorier, men du kan inte göra allt för hand.
Ange bildigenkännings API. Du kan använda API, tillsammans med en lämplig bildigenkänningsmaskin, för att skanna varje enskild bild och definiera den med angivna kriterier. Så du kan skanna biblioteket med bilder för oanständiga bilder och radera dem. Du kan skanna bilderna och sortera dem som innehåller mat i kategorin "mat" och stickade tyg i "woolen" -kategorin. När du väl har sagt API: n vad ska man göra, processen är automatiserad.
Det finns också möjligheter här för ökad verklighet och interaktiv bild och video. Du kan använda bildigenkänning för att få ett program att känna igen objekt i den verkliga världen. Till exempel kan du ta en bild av ett par sneakers som någon bär på gatan. Om programmet känner igen sneakersna kan bilden förstärkas med en länk för att köpa dem själv. Detta fördelar företag (det ger en omedelbar försäljningsmöjlighet) och gynnar användaren (de får vad de vill ha just nu).
Användaren drar nytta av bildigenkänning
Sneaker-exemplet ovan är bara ett uppenbart sätt att användarna kan dra nytta av bildigenkänning. Ökad verklighet betyder att vi direkt kan få tillgång till recensioner, prisinformation och mycket data genom att helt enkelt ta en bild av en produkt. Det ger användarna massiva datamängder för att hjälpa dem att fatta ett köpbeslut.
Mark Zuckerberg sammanfattade en ofta förbisedd fördel för bildigenkänning i sitt tal på AI tidigare i år. Han förutsåg ett bildigenkännings API som fungerade med blinda eller svagtsynade personer som kunde "läsa" en bild och beskriva vad det ser högt ut. Detta kan få massiva återverkningar för försämrade internetanvändare-eller, med ökad verklighet, ut i den verkliga världen någon gång ner i linjen.
Bildigenkänning spelar också en roll i fordonssäkerheten. De nya autonoma broms- och kollisionsundvikelsekniker som introduceras fungerar på samma sätt som de API som vi har pratat om. De skannar och utvärderar bilder många gånger i sekunden för att hålla dig och din bil säker medan du är på vägen. Den här teknologin som berättar autonoma bilar, som också finns runt dem.
Bildgenkännings-API: er kommer inte att revolutionera vår internetupplevelse på egen hand. De arbetar tillsammans med befintlig teknik för att lägga till ett lager av interaktion och nedsänkning till den värld vi ser. Medan artikelns exemplar är begränsade finns det stor potential för spel, filmer, bilindustrin, detaljhandeln, underhållning och någon teknikaktiverad bransch. Detta är bara början på vad intelligenta system kan uppnå!