Ein-Chip-System für Deep Learning
VPU mit integrierter neuronaler Recheneinheit
Intel bringt eine neue Movidius Myriad X Vision Processing Unit (VPU), die das Portfolio an End-to-End Lösungen im Bereich Künstliche Intelligenz (KI) ergänzt. Die VPU ermöglicht autonome Einsatzmöglichkeiten für ein breites Produktspektrum, von Drohnen, Robotern bis hin zu intelligenten Kamerasystemen und Virtueller Realität.
Myriad X ist ein Ein-Chip-System (System-on-a-Chip, SoC), auf dem sich neuronale Recheneinheiten befinden, die ausschließlich für die Beschleunigung von anspruchsvollen Deep Learning Inferenzen bestimmt sind. Die neuronale Recheneinheit ist ein Hardwareblock, der sich auf dem Chip befindet und dafür entwickelt wurde, tiefe neuronale Netze unter Hochgeschwindigkeit arbeiten zu lassen, ohne dabei viel Energie zu benötigen. Unbeeinflusst bleibt auch die notwendige Genauigkeit, damit die Geräte ihre Umwelt sehen, verstehen und schnell auf sie reagieren können. Durch die Einführung der neuronalen Recheneinheit ist die Myriad X Architektur in der Lage, 1 TOPS (Trillion operations per second) Rechenleistung in tiefen neuronalen Netzwerken zu liefern. Die Myriad X kann über 4 TOPS Gesamtleistung erbringen und ist durch ihren kleinen Formfaktor und der Fähigkeit zur Direktverarbeitung für autonome Systeme geeignet.
Viele Kombinationen möglich
Über die neuronale Recheneinheit hinaus kombiniert Myriad X Bild- und visuelle Verarbeitung und Deep Learning Inferenz in Echtzeit mit:
• Programmierbaren 128Bit VLIW Vektor Prozessoren: Mehrere Anwendungspipelines für Bildverarbeitung und -erkennung können gleichzeitig mit der Flexibilität von 16 Vektorprozessoren bearbeitet werden.
• Verstärkt konfigurierbaren MIPI Spuren (Lanes): RGB-Kameras mit bis zu 8HD Auflösung können direkt mit Myriad X verbunden werden. Durch die 16 MIPI Spuren (Lanes), die in einen ergiebigen Satz an Schnittstellen eingebunden sind, kann eine Durchsatzrate von bis zu 700 Mio. Pixeln in der Bildsignalverarbeitung erreicht werden.
• Verbesserten Sicht-Beschleunigern: Mehr als 20 Hardwarebeschleuniger werden genutzt, um Aufgaben wie Optical-Flow und Stereotiefe ohne zusätzliche Rechenkosten durchzuführen.
• 2,5MB homogenem Speicher auf dem Chip: Die auf dem Chip platzierte Speicherarchitektur ermöglicht bis zu 450GB interne Bandbreite pro Sekunde. Sowohl Latenzzeit als auch Energieverbrauch werden verringert, indem nur wenige Daten außerhalb des Chips übertragen werden müssen.
Die neue Generation von Movidius VPUs ist speziell für eingebettete Bildintelligenz gefertigt. Movidius VPUs sind hochleistungsfähig und haben einen geringen Energieverbrauch. Auch kontinuierlich hohe Arbeitslasten bei Deep Learning-Prozessen und beim Computersehvermögen bewältigen sie durch die Kombination folgender drei Bauelemente sehr schnell: (1) viele programmierbare VLIW Vektorprozessoren, deren Instruktionssatz auf Computervision und Deep Learning abgestimmt ist; (2) zahlreiche Hardwarebeschleuniger, die Bildsignalverarbeitung, Computer-Sehvermögen und Deep Learning Inferenzen fördern; und (3) frei zugängliche intelligente Speicherstrukturen, welche die Datenbewegung auf dem Chip reduzieren.
Firma: Intel GmbH
www.intel.de