Αποστολή στο Λας Βέγκας
Θέση μάχης απέναντι στους ισχυρούς της τεχνολογίας - Microsoft, Google, Meta και Open AI παίρνει η Amazon, λανσάροντας στο ετήσιο συνέδριο της, ReInvent 2024 που πραγματοποιείται αυτές τις ημέρες στο Λας Βέγκας, το δικό της foundational model, ονόματι Amazon Nova. Με τέσσερις εκδοχές, τρεις από τις οποίες είναι ήδη διαθέσιμες στο κοινό, η Amazon Web Services, φιλοδοξεί να ηγηθεί των gen AI εργαλείων επεξεργασίας για επιχειρήσεις, και να βοηθήσει κάθε «ενδιαφερόμενο να καινοτομήσει», όπως ανέφερε ο CEO της Amazon, Andy Jassy από το βήμα του ετήσιου συνεδρίου στο Λας Βέγκας.
Η οικογένεια foundational models που ανακοίνωσε η εταιρεία περιλαμβάνει τα Micro, Lite, Pro και Premier. Τα τρία πρώτα είναι διαθέσιμα ήδη από χθες στους πελάτες της AWS ενώ το Premier αναμένεται στις αρχές του 2025, σύμφωνα με τα όσα ανέφερε ο επικεφαλής της Amazon.
Στα παραπάνω θα πρέπει να προστεθούν και τα Amazon Nova Canvas, ένα υπερσύγχρονο μοντέλο δημιουργίας εικόνων και το Αmazon Nova Reel ένα υπερσύγχρονο μοντέλο δημιουργίας βίντεο. Το Nova Reel θα επιτρέπει στους χρήστες να δημιουργούν βίντεο διάρκειας έξι δευτερολέπτων, τα οποία μπορούν να είναι χρήσιμα, για παράδειγμα, για την παρουσίαση προϊόντων στον ιστότοπο της Amazon. Ωστόσο στους επόμενους μήνες θα ενεργοποιηθεί και η δυνατότητα δημιουργίας βίντεο διάρκειας έως δύο λεπτών.
Όσο για το Canvas, που μπορεί να δημιουργήσει εικόνα μέσα από σύντομη λεκτική περιγραφή, ο Jassy έδωσε έμφαση στο γεγονός ότι η Amazon θα προσφέρει την δυνατότητα υδατογραφήματος για να διασφαλίσει ότι το λογισμικό χρησιμοποιείται υπεύθυνα, αποτρέποντας τη διάδοση επιβλαβούς περιεχομένου.
«Συνεχίσαμε να δουλεύουμε πάνω στα δικά μας foundational models, σημειώνοντας τεράστια πρόοδο τους τελευταίους τέσσερις με πέντε μήνες. Σκεφτήκαμε λοιπόν ότι αν εμείς πήραμε αξία από αυτά, πιθανότατα θα νιώσουν το ίδιο και οι πελάτες μας».
Τα νέα Amazon Nova
Τα Amazon Nova, είναι βελτιστοποιημένα για 15 γλώσσες (αλλά κυρίως για τα αγγλικά) και παρουσιάζουν διαφορετικές δυνατότητες μεταξύ τους.
Το Micro μπορεί να δεχτεί μόνο κείμενο αλλά υπόσχεται πολύ χαμηλό latency, μεταξύ των τεσσάρων, επιτυγχάνοντας να επεξεργαστεί και να παράξει κείμενο στον ταχύτερο δυνατό χρόνο σε πολύ χαμηλό κόστος.
Η γρήγορη ταχύτητα είναι η ειδοποιός διαφορά και του Amazon Nova Lite, του έτερου πολυτροπικού μοντέλου χαμηλού κόστους που παρουσίασε η εταιρεία το οποίο μπορεί να επεξεργαστεί κείμενο, εικόνες και βίντεο. Όσο για το Pro προσφέρει έναν ισορροπημένο συνδυασμό ακρίβειας, ταχύτητας και κόστους για μια σειρά εργασιών.
Το ισχυρότερο όλων βέβαια είναι το Premier, ένα AI εργαλείο επεξεργασίας σχεδιασμένο για πολύπλοκες εργασίες, το οποίο αναμένεται εντός του 2025. Τα Pro και Premier, όπως και το Lite, μπορούν να αναλύουν κείμενο, εικόνες και βίντεο. Και τα τρία είναι κατάλληλα για εργασίες όπως η επεξεργασία εγγράφων και η σύνοψη συναντήσεων και διαγραμμάτων. Στην περίπτωση του Premier, ωστόσο, σύμφωνα με την Amazon προορίζεται για να δημιουργεί το ίδιο άλλα μοντέλα, παρά για να χρησιμοποιείται αυτούσιο.
Ειδοποιός διαφορά των συγκεκριμένων μοντέλων, όπως επεσήμαναν τα στελέχη της Amazon, είναι ότι δημιουργήθηκαν λαμβάνοντας υπόψη την υστέρηση που παρουσιάζουν άλλες αντίστοιχες εφαρμογές.
«Μέσα στην Amazon, έχουμε περίπου 1.000 εφαρμογές γεννητικής τεχνητής νοημοσύνης σε εξέλιξη και έχουμε αποκτήσει μια πανοραμική εικόνα για τα ζητήματα που ακόμα αντιμετωπίζουν οι δημιουργοί εφαρμογών», δήλωσε ο Rohit Prasad, Ανώτερος Αντιπρόεδρος του Amazon Artificial General Intelligence. «Τα νέα μας μοντέλα Amazon Nova προορίζονται να αντιμετωπίσουν αυτές τις προκλήσεις προσφέροντας μια πολύ καλή σχέση κόστους-αποτελεσματικότητας.»
Όπως επισημάνθηκε μάλιστα τα Amazon Nova Micro, Amazon Nova Lite και Amazon Nova Pro είναι τουλάχιστον 75% πιο οικονομικά από τα καλύτερα μοντέλα στις αντίστοιχες κατηγορίες νοημοσύνης που φιλοξενούνται στην πλατφόρμα της Amazon, Bedrock. Να σημειωθεί ότι τα νέα μοντέλα Amazon Nova όπως και άλλα FMs είναι ενσωματωμένα στο Amazon Bedrock, ώστε οι πελάτες της Amazon να μπορούν εύκολα να τα αξιολογήσουν για να αποφασίσουν ποιο είναι αυτό που εξυπηρετεί καλύτερα τις ανάγκες τους.
Τι έρχεται το 2025
Οι καινοτομίες ωστόσο δεν σταματούν εκεί καθώς ο επικεφαλής της Amazon επεσήμανε ότι το 2025 θα κάνουν την εμφάνιση τους δύο ακόμα μοντέλα Amazon Nova.
Ο λόγος για ένα μοντέλο μετατροπής ομιλίας σε ομιλία (speech-to-speech) και ένα φυσικό μοντέλο multimodal-to-multimodal «any-to-any», δηλαδή ένα μοντέλο που μπορείνα προσλαμβάνει οποιαδήποτε μορφή μετατρέποντάς τη σε οποιαδήποτε μορφή.
Το μοντέλο ομιλίας σε ομιλία θα κατανοεί τη ροή ομιλίας σε φυσική γλώσσα, ερμηνεύοντας λεκτικά και μη λεκτικά στοιχεία (όπως τον τόνο και τον ρυθμό), προσφέροντας φυσικές, ανθρωπόμορφες αλληλεπιδράσεις.
Αντίστοιχα το μοντέλο «από οποιαδήποτε μορφή σε οποιαδήποτε μορφή» θα είναι ικανό να επεξεργάζεται κείμενο, εικόνες, ήχο και βίντεο, προσφέροντας λύση στην εκτέλεση ποικίλων εργασιών, όπως η μετάφραση περιεχομένου από μια μορφή σε άλλη.
«Θα μπορείτε να εισάγετε κείμενο, ομιλία, εικόνες ή βίντεο και να εξάγετε κείμενο, ομιλία, εικόνες ή βίντεο», δήλωσε ο Jassy για το μοντέλο any-to-any κάνοντας λόγο για επεξεργασία χωρίς σύνορα.
«Από τα προσαρμοσμένα τσιπ Inferentia και Trainium που κατασκευάζουμε, μέχρι την προσφορά κορυφαίων θεμελιωδών μοντέλων στο Amazon Bedrock και AI εμπειριών όπως το Rufus και η Alexa, δεσμευόμαστε να παρέχουμε λύσεις Gen AI που προσφέρουν πραγματική αξία στους πελάτες μας. Στόχος μας είναι να χρησιμοποιούμε την τεχνητή νοημοσύνη για να απλοποιούμε τη ζωή των αγοραστών, πωλητών, διαφημιστών, επιχειρήσεων και όλων των ενδιάμεσων» ανέφερε o CEO της AWS, Matt Garman.
Άλλωστε όπως επεσήμανε ο Jassy «ποτέ δεν θα υπάρξει ένα εργαλείο που να κυριαρχεί στον κόσμο. Οι πελάτες θα θέλουν πάντα επιλογές και θα χρησιμοποιούν διαφορετικές λύσεις τεχνητής νοημοσύνης».