Cerebras Systems, en amerikansk oppstart, lanserte den største brikken som integrerte mer enn 1,2 billioner transistorer og hadde en størrelse på 46 225 kvadratmillimeter. Den nye Cerebras Wafer Scale Engine (WSE) -brikken er optimalisert for AI og er 56,7 ganger større enn den største grafikkbehandlingsenheten som måler 815 kvadratmeter og inneholder 21,1 milliarder transistorer. Den nye Cerebras Wafer Scale Engine (WSE) gir 3000 ganger mer høyhastighets on-chip-minne og leveres med 10 000 ganger mer minnebåndbredde. Den større størrelsen på brikken sørger for at informasjon kan behandles raskere og kan til og med redusere tid til innsikt, eller "treningstid" som gjør det mulig for forskerne å teste flere ideer, bruke mer data og løse nye problemer.
Cerebras WSE er designet for kunstig intelligens og inneholder grunnleggende innovasjoner som fremmer teknologien ved å løse flere tiår gamle tekniske utfordringer som er begrenset med chipstørrelse - for eksempel tilkobling på tvers av retikler, utbytte, strømforsyning og emballasje. WSE kan akselerere beregninger og kommunikasjon, noe som reduserer treningstiden. WSE har 56,7 ganger mer silisiumareal enn den største grafikkbehandlingsenheten. WSE kan også tilby flere kjerner for å gjøre flere beregninger og har mer minne nærmere kjernene, slik at kjernene kan fungere effektivt. All kommunikasjon holdes på silisium selv på grunn av det store utvalget av kjerner og minne er innebygd på en enkelt brikke.
Cerebras WSE-brikken inneholder 46,225 mm2 silisium og huser 400 000 AI-optimalisert, ikke-hurtigbuffer, ikke-overhead, beregningskjerner og 18 gigabyte lokalt, distribuert, superrask SRAM-minne. Brikken kommer med 9 petabyte per sekund minnebåndbredde der kjerner er koblet sammen med et finkornet, maskinvare-på-chip nettverkstilkoblet kommunikasjonsnettverk som gir en samlet båndbredde på 100 petabit per sekund. Dette betyr at kommunikasjonsbåndbredden med lav latens til WSE er ekstremt stor, noe som gjør at kjernegruppene samarbeider med maksimal effektivitet, og minnebåndbredde er ikke lenger en flaskehals. Mer lokalt minne, flere kjerner og et stoff med lav latens med høy båndbredde kombinert sammen danner den optimale arkitekturen for å akselerere AI-arbeid.
Funksjonene til Cerebras WSE-brikke:
- Økte kjerner: WSE integrerer 400 000 AI-optimaliserte beregningskjerner kalt SLAC (Sparse Linear Algebra Cores) som er programmerbare, fleksible og optimaliserte for den sparsomme lineære algebraen som ligger til grunn for all nevrale nettverksberegning. SLACs programmerbarhetsfunksjon sørger for at kjernene enkelt kan kjøre alle nevrale nettverksalgoritmer i stadig skiftende maskinlæringsfelt. WSE-kjernene inneholder Cerebras-oppfunnet sparsity-høstingsteknologi som akselererer beregningsytelse på sparsomme arbeidsbelastninger (arbeidsbelastninger som inneholder nuller) som dyp læring.
- Forbedret minne: Cerebras WSE integrerer mer lokalt minne sammen med flere kjerner, noe som er mer enn noen chip som muliggjør fleksibel, rask beregning med lavere ventetid og med mindre energi. WSE leveres med 18 GB (gigabyte) minne på chip tilgjengelig fra kjernen i en klokkesyklus. Denne samlingen av kjernelokalt minne gjør at WSE leverer til sammen 9 petabyte per sekund minnebåndbredde, som er 10.000 X mer minnebåndbredde og 3000 X