Память разделяемая (для CUDA) — это 16-килобайтный блок памяти с общим доступом для всех потоковых процессоров в мультипроцессоре. Эта память весьма быстрая, такая же, как регистры. Она обеспечивает взаимодействие потоков, управляется разработчиком напрямую и имеет низкие задержки. Преимущества разделяемой памяти: использование в виде управляемого программистом кэша первого уровня, снижение задержек при доступе исполнительных блоков (ALU) к данным, сокращение количества обращений к глобальной памяти.
[Программирование графических приложений. Словарь узкоспециализированных терминов. ФГАОУ ВПО «УрФУ имени первого Президента России Б.Н. Ельцина». (Электронный ресурс). Режим доступа: http:// media.ls.urfu.ru›435/1148/, свободный.]