Architettura Llano nel dettaglio
Come esplicitato precedentemente, all'interno di una APU Llano troviamo fino a 4 core x86, e fino a 400 stream processor, suddivisi in SIMD Engine da 80 stream processor ciascuno. CPU e GPU condividono l'accesso alla memoria di tipo DDR3 attraverso un memory controller integrato ad alte prestazioni. Il controller integrato è stato migliorato nella gestione dei trasferimenti dati, negli algoritmi di prefetching e nella massima frequenza RAM supportata, che arriva a 1866 MHz ed è confermata la presenza di un bus a 128 bit dual channel.
L'APU integra inoltre un decoder video di tipo UVD 3 di cui abbiamo già ampiamente parlato in altre recensioni, un controller PCI Express x16 2.0, nonché la gestione dei display tramite interfacce HDMI 1.4a, DVI e Display Port. L'APU è inoltre collegata tramite il bus Unified Media Interface al Fusion Controller HUB (FCH) Hudson che si occupa della gestione delle periferiche di I/O.
Tra le feature più interessanti del chipset Hudson D3 troviamo il supporto agli standard di nuova generazione con fino a 6 porte Sata 6Gb/s (con possibilità di RAID 0 e 1) e fino a 4 USB 3.0. Gestisce inoltre 10 USB 2.0, 4 linee PCI Express x1, il chip HD Audio e le interfacce PCI. Vedremo in seguito nel dettaglio le feature di questo chipset.
Per quanto riguarda i dettagli dei Core x86 delle APU Llano non ci sono novità facilmente visibili. L’architettura di base è quella dei core di tipo “Stars”, ma con alcuni miglioramenti che portano ad un incremento medio dell'IPC del 6% rispetto al core Propus: il raddoppio della cache L2 per ogni core, pari ora ad 1MB, e l’uso di celle ad 8 transistor per la sola cache dati L1, più veloce, più affidabile e capace di funzionare ad una tensione più bassa e perciò meno avida di energia, l’aumento delle varie code interne (della unità di controllo istruzioni, delle istruzioni intere, in virgola mobile e di memoria) il miglioramento del moltiplicatore intero e l’integrazione di un divisore intero molto efficiente, l’aumento dei Translation Lookaside Buffers per la gestione della memoria virtuale e il miglioramento del controller di memoria, in particolare come velocità di trasferimento e algoritmi di prefetching. In più la tecnologia TurboCore è stata aggiornata alla versione 2.0, con una migliore stima della potenza istantanea assorbita e il bilanciamento preciso della potenza tra GPU e CPU.
Non ci potremo aspettare grandi prestazioni a livello computazionale dai Core delle CPU Llano, poiché partiamo dalle prestazioni del core Propus. Tuttavia la presenza di un numero molto elevato di Stream Processor rendono sulla carta le APU Llano le APU più potenti mai prodotte in termini di GFLOPS. Inoltre le tecnologie Zero Copy e Pin In Place, consentono un notevole miglioramento dello sfruttamento della memorie, rispetto a una IGP ed anche rispetto a una scheda discreta. Tali tecnologie consentono di poter far utilizzare direttamente i dati presenti in memoria centrale alla GPU, senza dover passare per il BUS PCI Express, come succedeva in passato. La potenza offerta dai SIMD AMD potrà però essere sfruttata soltanto da quelle applicazioni in grado di beneficiare dell'accelerazione su GPU. A tal fine AMD sta lavorando a stretto contatto con molte software house, in modo da permettere gli utenti di sfruttare in modo efficiente queste potenzialità inespresse.