ΜΕΤΑ: Νέο μοντέλο Τεχνητής Νοημοσύνης αναγνωρίζει αντικείμενα μέσα σε εικόνες και βίντεο

Η εταιρεία του Μαρκ Ζάκεμπεργκ ρίχνει το δικό της χαρτί στην κούρσα του AI, που συνεχίζεται σε φρενήρεις ρυθμούς μετά την αποκάλυψη του ChatGPT.
Reuters

H ειταρεία - ιδιοκτήτης του Facebook, Meta με μεγαλομέτοχο τον Μαρκ Ζάκεμπεργκ, παρουσίασε ένα νέο μοντέλο τεχνητής νοημοσύνης (Τετάρτη 5 Απριλίου 2023) που μπορεί να διακρίνει μεμονωμένα αντικείμενα μέσα από μια εικόνα, μαζί με ένα σύνολο δεδομένων (datasets) που σύμφωνα με την εταιρεία είναι τα ευρύτερα στο είδος τους.

Το τμήμα έρευνας της εταιρείας ανέφερε σε ανάρτησή της, ότι το Segment Anything Model, ή SAM, μπορεί να αναγνωρίσει αντικείμενα σε εικόνες και βίντεο, ακόμη και σε περιπτώσεις που δεν είχε συναντήσει αυτά τα αντικείμενα στην εκπαίδευσή του.

Χρησιμοποιώντας το SAM, τα αντικείμενα μπορούν να επιλεγούν κάνοντας κλικ πάνω τους ή γράφοντας οδηγίες σε μορφή κειμένου. Σε μια επίδειξη, γράφοντας τη λέξη «γάτα», το SAM ενεργοποιήθηκε και άρχισε να σχεδιάζει διαχωριστικά πλαίσια, γύρω από καθεμία από πολλές γάτες σε μια φωτογραφία.

Οι μεγάλες εταιρείες τεχνολογίας αποκαλύπτουν τις ανακαλύψεις τους στο πεδίο της τεχνητής νοημοσύνης, σε καταιγιστικούς ρυθμούς, από τότε που το chatbot «ChatGPT», το οποίο υποστηρίζεται από τη Microsoft, προκάλεσε αίσθηση παγκοσμίως το φθινόπωρο, προκαλώντας ένα κύμα επενδύσεων και έναν αγώνα δρόμου για κυριαρχία στον χώρο.

Το μοντέλο της Meta έχει πολλά κοινά χαρακτηριστικά με τον τύπο της γενετικής τεχνητής νοημοσύνης που διαδόθηκε από το ChatGPT, το οποίο δημιουργεί ολοκαίνουργιο περιεχόμενο, αντί απλώς να προσδιορίζει ή να κατηγοριοποιεί δεδομένα όπως άλλα μοντέλα AI.

3340EC-META-PLATFORMS_AI_CAPTIONED__O_
3340EC-META-PLATFORMS_AI_CAPTIONED__O_
Reuters

Τέτοια παραδείγματα περιλαμβάνουν ένα εργαλείο που αναπτύσσει σουρεαλιστικά βίντεο με βάση μηνύματα κειμένου και ένα άλλο που δημιουργεί εικονογραφήσεις παιδικών βιβλίων βασιζόμενο σε αφήγηση.

Ο διευθύνων σύμβουλος της ΜΕΤΑ, Mαρκ Ζάκεμπεργκ, είπε ότι η ενσωμάτωση τέτοιων «δημιουργικών βοηθημάτων» τεχνητής νοημοσύνης στις εφαρμογές της Meta αποτελεί προτεραιότητα για φέτος.

Η Meta χρησιμοποιεί ήδη τεχνολογία παρόμοια με το SAM εσωτερικά για δραστηριότητες όπως η προσθήκη ετικετών σε φωτογραφίες, η εποπτεία απαγορευμένου περιεχομένου και ο καθορισμός σχετικά με αναρτήσεις που προτείνονται στους χρήστες του Facebook και του Instagram.

Η εταιρεία υποστηρίζει ότι η κυκλοφορία του SAM θα διευρύνει την πρόσβαση σε αυτό το είδος τεχνολογίας.

Το μοντέλο και το σύνολο δεδομένων του SAM θα είναι διαθέσιμα για λήψη με μη-εμπορική άδεια. Οι χρήστες που ανεβάζουν τις δικές τους εικόνες πρέπει επίσης να συμφωνήσουν, ότι θα το χρησιμοποιούν μόνο για ερευνητικούς σκοπούς.

Δημοφιλή