A Google AI csapata egy blogbejegyzésben azt írta: a televíziókhoz és az asztali számítógépekhez készített felvételek általában 16:9 vagy 4:3 formátumban elérhetők, amik az okostelefonos felhasználókhoz sokszor értelmezhetetlen képarányban jutnak el. A probléma megoldásához általában a szerkesztőknek manuálisan kell azonosítaniuk az egyes képkockák tartalmát, nyomon kell követniük a változásokat és az átmeneteket képkockáról képkockára, majd az egyes jelenetekhez kell igazítaniuk a vágási régiókat. Ez a folyamat rengeteg erőfeszítést és időt igényel, melyet jobban is lehetne hasznosítani –írta a Gizmodo.
Az AutoFlip célja, hogy ezt a problémát egy olyan keretrendszer segítségével oldja meg, amely videóstabilizátor szerű technikákat alkalmaz, hogy a kamera fókuszát azon tartsa, ami fontos.
A Google csapata úgy magyarázta, hogy az eszköz – a MediaPipe keretrendszerén alapuló – „ML-kompatibilis objektum-felismerési és nyomkövető technológiákat használ a videotartalom intelligens megértésére”, így képes állítani a videó képkockáit felvétel közben is.
Emellett az AutoFlip automatikusan elemzi az egyes jeleneteket és eldönti, hogy statikus keretet vagy követési módot kell-e alkalmaznia.