Η Microsoft ενώνει data centers για να δημιουργήσει το πρώτο «υπερεργοστάστιο AI»

Η Microsoft δημιουργεί μια νέα γενιά data centers, τα οποία δεν λειτουργούν πλέον ως μεμονωμένες εγκαταστάσεις αλλά ως κόμβοι ενός ενιαίου δικτύου που η εταιρεία χαρακτηρίζει «υπερεργοστάσιο AI».
Το νέο data center στην Ατλάντα των ΗΠΑ είναι το δεύτερο της οικογένειας Fairwater της Microsoft και έχει την ίδια αρχιτεκτονική και σχεδιασμό με αυτό που ολοκληρώνει η εταιρεία στο Ουισκόνσιν. Σε αντίθεση με τα παραδοσιακά data centers, οι εγκαταστάσεις Fairwater συνδέονται απευθείας μεταξύ τους και – σταδιακά, μαζί με άλλες που βρίσκονται υπό κατασκευή στις ΗΠΑ – θα δημιουργήσουν μια υποδομή ικανή να εκπαιδεύει μοντέλα τεχνητής νοημοσύνης σε χρόνους που μέχρι τώρα θεωρούνταν αδύνατοι.
Σαν εικονικός υπερυπολογιστής
Το δίκτυο αυτό θα ενώσει πολλαπλές εγκαταστάσεις που φιλοξενούν εκατοντάδες χιλιάδες προηγμένες μονάδες επεξεργασίας γραφικών (GPU), εκατομμύρια πυρήνες επεξεργαστών (CPU cores) και exabytes αποθήκευσης (ένα exabyte ισούται με 1 εκατ. terabytes…). Όλες αυτές οι μονάδες θα συνεργάζονται για την υποστήριξη της OpenAI, της ομάδας Microsoft AI Superintelligence, των δυνατοτήτων Copilot και άλλων απαιτητικών φορτίων εργασίας.
«Χτίζουμε ένα κατανεμημένο δίκτυο που μπορεί να λειτουργήσει σαν ένας εικονικός υπερυπολογιστής για την αντιμετώπιση των μεγαλύτερων προκλήσεων του κόσμου με τρόπους που δεν θα ήταν δυνατοί σε μια μεμονωμένη εγκατάσταση. Η χρήση του όρου “υπερεργοστάσιο AI” δεν είναι τυχαία», σημειώνει ο Alistair Speirs, υπεύθυνος Microsoft για την υποδομή της cloud υπηρεσίας Azure.
Τα νέα data centers Fairwater AI έχουν ένα μοναδικό σχεδιασμό που τα διαφοροποιεί από τις προηγούμενες γενιές. Σύμφωνα με τη Microsoft, το κέντρο της Ατλάντα, για παράδειγμα, διαθέτει:
- Μια νέα αρχιτεκτονική chip και rack που προσφέρει την υψηλότερη απόδοση ανά rack από οποιαδήποτε άλλη πλατφόρμα cloud που διατίθεται σήμερα
- Συστήματα NVIDIA GB200 NVL72 σε κλίμακα rack που μπορούν να επεκταθούν σε εκατοντάδες χιλιάδες GPU NVIDIA Blackwell
- Σχεδιασμό δύο ορόφων που επιτρέπει μεγαλύτερη πυκνότητα GPU
- Προηγμένη υγρή ψύξη που καταναλώνει σχεδόν μηδενική ποσότητα νερού κατά τη λειτουργία της
- Έξυπνο δίκτυο, που επιτρέπει γρήγορη επικοινωνία μεταξύ των GPU
- Ένα νέο ειδικό δίκτυο που το συνδέει με υπολογιστικά clusters AI σε άλλες εγκαταστάσεις
Η ανάγκη για μια τέτοιου είδους υποδομή γίνεται όλο και πιο επιτακτική καθώς τα σύγχρονα μοντέλα AI αυξάνουν εκθετικά τον αριθμό παραμέτρων τους και απαιτούν τεράστιες ποσότητες δεδομένων. Πλέον, η εκπαίδευση ενός μοντέλου δεν είναι ενιαία εργασία αλλά μια αλληλουχία σταδίων – περιλαμβάνει προεκπαίδευση, τελειοποίηση, ενισχυτική μάθηση, αξιολόγηση και παραγωγή συνθετικών δεδομένων, με κάθε στάδιο να έχει τις δικές του μοναδικές απαιτήσεις. Αυτό σημαίνει ότι η υποδομή πρέπει να είναι τόσο μεγάλη όσο και ευέλικτη.
Δικτύωση και ψύξη
Για να επιτευχθεί αυτό, η Microsoft ανέπτυξε το δίκτυο AI WAN, το οποίο συνδέει απομακρυσμένα κέντρα σχεδόν με την ταχύτητα του φωτός μέσω πάνω από 190.000 χιλιομέτρων ειδικών οπτικών ινών. Το σύστημα έχει βελτιστοποιηθεί ώστε να ελαχιστοποιεί τη συμφόρηση, επιτρέποντας σε εγκαταστάσεις εκατοντάδες ή και χιλιάδες χιλιόμετρα μακριά να συνεργάζονται σαν μία ενιαία υπολογιστική μονάδα.
Η τεράστια πυκνότητα υπολογιστικών μονάδων δημιουργεί και τεράστια θερμικά φορτία. Για τον λόγο αυτό η Microsoft ανέπτυξε σύνθετο κλειστό σύστημα υγρής ψύξης, το οποίο αφαιρεί θερμότητα από τους επεξεργαστές και την αποβάλλει εκτός κτιρίου πριν το υγρό επιστρέψει ψυχόμενο. Η κατανάλωση νερού παραμένει ελάχιστη και αυτό αντικαθίσταται μόνο όταν οι χημικές μετρήσεις το επιβάλλουν.





