Η Φέι Φέι Λι, μια από τις κορυφαίες ερευνήτριες στον τομέα της τεχνητής νοημοσύνης στο Πανεπιστήμιο του Στάνφορντ, ανακοίνωσε ότι εξασφάλισε χρηματοδότηση ύψους 230 εκατομμυρίων δολαρίων για μια νέα startup που θα αναπτύξει τεχνολογίες ΑΙ ικανές να κατανοούν τον φυσικό κόσμο σε τρεις διαστάσεις. Η είδηση επιβεβαιώθηκε την Παρασκευή από την εταιρεία.
Μεταξύ των επενδυτών της World Labs, της startup που ίδρυσε η Λι μαζί με τρεις συνεργάτες της, βρίσκονται μεγάλες εταιρείες τεχνολογίας όπως η Intel, η AMD και η Nvidia.
Η 48χρονη Λι είναι μία από τους 100 πιο επιδραστικούς ανθρώπους στον τομέα της τεχνητής νοημοσύνης για το 2023, σύμφωνα με το περιοδικό Time. Από το 2017 έως το 2018, ήταν η επικεφαλής του τμήματος ΑΙ στην Google Cloud.
Έχει επίσης υπηρετήσει στο διοικητικό συμβούλιο του Twitter και έχει υπάρξει σύμβουλος τόσο του Λευκού Οίκου όσο και του ΟΗΕ.
«Ο τρόπος με τον οποίο κατανοούμε τη δομή του κόσμου, είτε είναι φανταστικός είτε πραγματικός, θα είναι ένα θεμελιώδες κομμάτι του παζλ της τεχνητής νοημοσύνης»
Η Λι, που έχει κερδίσει τον τίτλο της «νονάς της ΑΙ», είναι γνωστή για τη δημιουργία του ImageNet, μιας μεγάλης βάσης δεδομένων εικόνων που χρησιμοποιήθηκε για την εκπαίδευση των πρώτων μοντέλων που μπορούσαν να αναγνωρίζουν αντικείμενα με ακρίβεια.
Η ανακοίνωση της Παρασκευής επιβεβαίωσε προηγούμενες αναφορές του Reuters από τον Μάιο, σύμφωνα με τις οποίες η Λι εργάζεται πάνω σε μοντέλα «χωρικής νοημοσύνης» που είναι ικανά να κατανοούν τον κόσμο σε τρεις διαστάσεις.
Οι τρεις άλλοι συνιδρυτές της World Labs είναι οι ερευνητές μηχανικής όρασης Τζάστιν Τζόνσον, Κρίστοφερ Λάσνερ και Μπεν Μίλντενχολ.
Τα σύγχρονα μοντέλα τεχνητής νοημοσύνης είναι ικανά να παράγουν κείμενα, εικόνες και βίντεο με βάση τις οδηγίες του χρήστη, αλλά όπως δήλωσε η Λι στο Reuters, αυτό δεν προσφέρει μια πλήρη εικόνα του πώς είναι δομημένος ο τρισδιάστατος κόσμος.
«Η κατανόηση της δομής του κόσμου, είτε είναι φανταστική είτε πραγματική, θα είναι κρίσιμη για την ανάπτυξη της τεχνητής νοημοσύνης» είπε.
Η «χωρική νοημοσύνη», όπως πρόσθεσε, θα επιτρέψει στις μηχανές να έχουν καλύτερες ικανότητες συλλογισμού και να αποφεύγουν φαινόμενα «παραισθήσεων», όπως τα λάθος χέρια με ανώμαλο αριθμό δακτύλων, ένα κοινό πρόβλημα στα σημερινά μοντέλα συνθετικών εικόνων.
Αυτές οι τεχνολογίες θα μπορούσαν επίσης να εφαρμοστούν σε αυτόνομα ρομπότ ή σε περιβάλλοντα εικονικής πραγματικότητας.
Η World Labs, που έχει έδρα το Σαν Φρανσίσκο και απασχολεί 20 άτομα, θα αναπτύξει αυτό που οι ερευνητές ονομάζουν «μεγάλα κοσμικά μοντέλα» (LWM), σε αντιστοιχία με τα «μεγάλα γλωσσικά μοντέλα» όπως το ChatGPT.
Αυτά τα μοντέλα θα βασίζονται στην αρχιτεκτονική του μετασχηματιστή, που χρησιμοποιείται και στο ChatGPT, αλλά θα περιλαμβάνουν και άλλες καινοτομίες, σύμφωνα με την Λι.
Εκτός από την εργασία της στην εταιρεία, η Λι θα συνεχίσει να δραστηριοποιείται στο Ινστιτούτο Ανθρωποκεντρικής ΑΙ του Στάνφορντ.
Η World Labs είναι η δεύτερη επιχειρηματική της προσπάθεια: όπως έχει αναφέρει στα απομνημονεύματά της, όταν ήταν φοιτήτρια στο Στάνφορντ, είχε δανειστεί χρήματα για να αγοράσει ένα καθαριστήριο για τους γονείς της και εργαζόταν και η ίδια εκεί τα Σαββατοκύριακα.