Η Amazon Web Services (AWS) ανακοινώνει ότι το Ινστιτούτο Τεχνολογίας και Καινοτομίας του Άμπου Ντάμπι εκπαίδευσε το μεγάλο γλωσσικό μοντέλο Falcon 40B αξιοποιώντας τις καινοτόμες τεχνολογίες AWS.
Το Falcon LLM, ένα θεμελιώδες μεγάλο γλωσσικό μοντέλο (large language model, LLM) διαθέτει εντυπωσιακή χωρητικότητα 40 δισεκατομμυρίων παραμέτρων και εκπαιδεύτηκε σε 1 τρισεκατομμύριο tokens. Κατασκευάστηκε από το μηδέν με τη χρήση εργασιών προεπεξεργασίας δεδομένων και εκπαίδευσης του μοντέλου που κατασκευάστηκαν στο Amazon SageMaker.
Το μοντέλο Falcon 40B έχει επιδείξει υψηλές επιδόσεις και ακρίβεια και είναι το μοντέλο ανοικτού κώδικα με την υψηλότερη κατάταξη στον δημόσιο πίνακα κατάταξης Hugging Face Open LLM.
Οι πελάτες της AWS μπορούν να έχουν πρόσβαση στο Falcon 40B μέσω του Amazon SageMaker για να αξιοποιήσουν τις δυνατότητές του για εφαρμογές όπως η μετάφραση, η απάντηση ερωτήσεων, η περίληψη και η αναγνώριση εικόνων.
Η open-source αρχιτεκτονική του Falcon 40B επιτρέπει στους χρήστες να κατασκευάζουν και να προσαρμόζουν εργαλεία AI που ανταποκρίνονται στις μοναδικές ανάγκες των χρηστών, διευκολύνοντας την απρόσκοπτη ενσωμάτωση και εξασφαλίζοντας τη μακροπρόθεσμη διατήρηση των δεδομένων.
Το Falcon LLM είναι επίσης διαθέσιμο και μέσω του JumpStart, τον κόμβο μηχανικής μάθησης (ML) του SageMaker που προσφέρει προ-εκπαιδευμένα μοντέλα, ενσωματωμένους αλγορίθμους και προκατασκευασμένα πρότυπα λύσεων υποστηρίζοντας την άμεση πρόσβαση των χρηστών σε διαδικασίες μηχανικής μάθησης. Οποιοσδήποτε μπορεί να αναπτύξει και να χρησιμοποιήσει τα Falcon LLMs με μερικά κλικ στο SageMaker Studio ή προγραμματιστικά μέσω του SageMaker Python SDK.
Νωρίτερα φέτος, η AWS ανακοίνωσε μια σειρά καινοτόμων λύσεων Machine Learning για την υποστήριξη εφαρμογών Generative AI, συμπεριλαμβανομένης της υπηρεσίας cloud με την ονομασία Bedrock για τη δημιουργία εφαρμογών Generative AI και δωρεάν πρόσβαση στο Amazon CodeWhisperer για μεμονωμένους προγραμματιστές.
Το Amazon Bedrock είναι μια νέα υπηρεσία που προσφέρει στους χρήστες τη δυνατότητα εύκολης δημιουργίας έτοιμων προς χρήση εφαρμογών Generative AI, οι οποίες μπορούν να παράγουν κείμενο, εικόνες, ήχο και συνθετικά δεδομένα.
Η Bedrock θα παρέχει πρόσβαση σε γλωσσικά μοντέλα αιχμής που έχουν δημιουργήσει η Anthropic και η AI21, δύο startup εταιρείες που αναπτύσσουν γλωσσικά μοντέλα. Η AWS θα προσφέρει επίσης πρόσβαση στο Stable Diffusion, ένα μοντέλο τεχνητής νοημοσύνης για τη δημιουργία εικόνων, από τη Stability AI, μια startup που αναπτύσσει μια σειρά Generative AI μοντέλων ανοιχτού κώδικα. Η AWS διαθέτει δύο παραγωγικά γλωσσικά μοντέλα. Το Titan Text, το οποίο παρέχει τη δυνατότητα παραγωγής κειμένου, και το Text Embeddings το οποίο αναπτύσσει μια μαθηματική αναπαράσταση του κειμένου που μπορεί να χρησιμοποιηθεί για εργασίες όπως η μετάφραση και η αναζήτηση.
Επιπλέον το Bedrock θα επιτρέψει στους χρήστες του να χρησιμοποιούν αυτά τα μοντέλα χωρίς να υπάρχει ο κίνδυνος οι πληροφορίες που εισάγουν να διαρρεύσουν στην ευρύτερη δεξαμενή δεδομένων που χρησιμοποιούνται για την εκπαίδευση αυτών των μοντέλων, δίνοντας με αυτόν τον τρόπο λύση σε οργανισμούς που θέλουν να δημιουργήσουν τα δικά τους Generative AI προϊόντα – ιδίως εταιρείες που διαχειρίζονται ευαίσθητες πληροφορίες των πελατών τους, όπως π.χ. εταιρείες που παρέχουν χρηματοπιστωτικές υπηρεσίες ή υγειονομική περίθαλψη.
Η AWS ανακοίνωσε επίσης ότι μεμονωμένοι προγραμματιστές μπορούν να έχουν δωρεάν πρόσβαση στο Amazon CodeWhisperer, χωρίς κανένα όριο χρήσης. Το Amazon CodeWhisperer είναι ένα AI εργαλείο δημιουργίας κώδικα, το οποίο κάνει τις διαδικασίες ταχύτερες και ευκολότερες για κάθε προγραμματιστή λογισμικού. Αξιοποιεί Generative AI δυνατότητες για να δημιουργεί κώδικα σε πραγματικό χρόνο, με βάση τα σχόλια του χρήστη και τον ήδη υπάρχοντα κώδικα
Η AWS έχει βοηθήσει περισσότερους από 100.000 πελάτες της να καινοτομήσουν με τη χρήση υπηρεσιών Τεχνητής Νοημοσύνης και Μηχανικής Μάθησης. Η ηγετική θέση της AWS σε αυτούς τους κλάδους είναι αποτέλεσμα της επένδυσης της Amazon στην ανάπτυξη εφαρμογών Τεχνητής Νοημοσύνης και Μηχανικής Μάθησης για περισσότερα από 20 χρόνια, με τις εφαρμογές αυτές να αποτελούν αναπόσπαστο κομμάτι κάθε δραστηριότητας της εταιρείας, σε παγκόσμιο επίπεδο.