HBF(High-Bandwidth Flash, 고대역폭 플래시)는 3D NAND 플래시를 HBM처럼 병렬·스택 구조로 묶어, 테라바이트(…TB)급 용량과 수백 GB/s급 대역폭을 동시에 노리는 차세대 비휘발성 메모리·스토리지 아키텍처다. 주로 AI 추론(LLM 등)과 데이터 집약적 가속기를 겨냥하며, HBM을 완전히 대체하기보다는 용량·비용 측면에서 보완하는 역할을 할 것으로 예상된다.emergentmind+3
1. 등장 배경과 목표
- AI 대규모 모델(LLM), HPC, 데이터 분석 워크로드는 “대역폭도 매우 높고, 용량도 매우 큰” 메모리를 요구한다.research4lab.tistory+1
- HBM은 수백 GB/s급 대역폭 제공에는 탁월하지만, 스택당 수십 GB 수준의 용량 한계와 높은 비용, 발열·패키징 난이도라는 약점을 가진다.microchipusa+2
- 반대로 3D NAND 플래시는 수백~수천 레이어를 쌓아 매우 저렴하게 테라바이트급 용량을 제공할 수 있지만, 인터페이스 대역폭이 낮고 지연(latency)이 DRAM보다 훨씬 크다는 문제가 있다.tomshardware+1
HBF는 “HBM급(or 근접한) 대역폭 + 플래시 특유의 초대용량 + 비휘발성 + 상대적으로 낮은 비용”이라는 조합을 목표로 한다. 특히, 추론용 LLM처럼 “거대한 가중치를 자주 읽지만, 상대적으로 쓰기는 적은(read‑heavy, mostly-static weight)” 워크로드에서 최적화된 솔루션을 지향한다.tomshardware+3
2. 기본 구조와 동작 원리
2-1. 3D NAND 스택 + 다이 스태킹
- HBF는 기본 저장 매체로 3D NAND 다이를 사용한다.emergentmind+1
- 각 다이 자체가 수백 레이어의 3D 셀로 구성되고, 이러한 다이들을 여러 층으로 TSV(Through‑Silicon Via)나 유사 기술로 수직 적층해 하나의 스택 패키지를 만든다.blocksandfiles+1
- 결과적으로 “스택된 레이어(3D 셀) 위에 다시 스택된 다이 구조”가 되어, 매우 높은 집적도와 1스택당 수 TB에 가까운 용량을 확보할 수 있다.blocksandfiles+1
예를 들어 한 구현에서 HBF 스택 하나가 약 1.6 TiB 용량을 제공하며, 이는 HBM4 스택(수십~100 GiB 수준)에 비해 한 스택에서 한 자릿수 이상 더 큰 용량이다.[emergentmind]
2-2. 미니 어레이 분할과 병렬 액세스
- SanDisk가 제안한 HBF 구조의 핵심은 “거대한 NAND 어레이를 수많은 미니 어레이로 쪼개고, 각각을 병렬로 동시에 접근한다”는 개념이다.eenewseurope+1
- 이렇게 나눈 수많은 미니 어레이를 여러 채널(channel)과 여러 way(way interleaving)로 제어해, 플래시 전체를 고도로 병렬화된 데이터 소스로 활용한다.[emergentmind]
- 컨트롤러는 각 채널·way에 걸쳐 데이터를 스트라이핑하고 스케줄링하여, 전체 스택 차원에서 수백 GB/s급 집계 대역폭을 목표로 한다.eenewseurope+1
연구 결과(기존 DDR형 플래시 인터페이스 실험)에서는, DDR 동기식 인터페이스와 다중 way 인터리빙을 통해 기존 싱글 데이터 레이트(SDR) 플래시에 비해 읽기 1.65~2.76배, 쓰기 1.09~2.45배 대역폭 향상이 가능함이 보고되며, 16‑way에서는 읽기 및 쓰기 대역폭이 최대 2.75배/2.45배까지 증가한 사례가 있다.[emergentmind]
2-3. HBM 스타일 호스트 인터페이스
- HBF는 외부 인터페이스 측면에서 HBM과 유사한 수백~수천 개의 핀과 멀티‑Gb/s급 입출력 속도를 가진 “HBM‑like” 인터페이스를 채택한다.tomshardware+2
- 이를 통해 기존 HBM 컨트롤러 및 PHY와의 직접 연결, 또는 변형된 버전으로 CXL/PCIe 기반 연결도 가능하게 설계할 수 있다는 제안이 있다.[emergentmind]
- 즉, 논리적으로는 HBM 스택을 달던 자리에 HBF 스택을 붙일 수 있도록, 신호 수준·핀 구성·프로토콜을 HBM과 상당히 유사하게 맞추려는 방향이다.tomshardware+1
일부 연구에서는 기존 플래시 패키지와의 물리적 핀 호환성을 유지하면서도 DDR 동기식 인터페이스와 멀티채널·멀티 way를 통해 대역폭을 극대화하는 구조도 제시한다.[emergentmind]
2-4. 대역폭·지연·용량 특성
Emergent Mind 요약 기준으로, 한 HBF 스택의 목표 스펙은 대략 다음과 같이 제시된다.[emergentmind]
- 용량: 약 1.6 TiB/스택 수준
- 대역폭: 약 300~800 GB/s/스택 수준(보수적인 하한은 80 GB/s 정도로 제시)
- 지연: 플래시 특성상 약 10 µs(마이크로초) 수준으로, DRAM 기반 HBM의 ~100 ns에 비해 두어 자릿수 이상 느림
- 전력: 스택당 20~80 W 수준, GB/s/W, GiB/W 지표에서 기존 구조 대비 의미 있는 개선
또한 한 비교 표에서는 다음과 같이 정리한다.[emergentmind]
- HBM4: 10~100 GiB/스택, ~300~800 GB/s, ~100 ns, 사실상 무제한 쓰기 내구성
- DDR5: ~64 GiB, ~20~50 GB/s, ~50 ns
- 일반 플래시 카드: ~4 GiB, ~0.1 GB/s, ~10 µs
- HBF 스택: ~1.6 TiB, ~300~800 GB/s, ~10 µs, 플래시 특유의 제한된 쓰기 내구성
즉 HBF는 “HBM급 대역폭 + 플래시급 용량·지연”이라는 절충적인 위치에 놓인다.[emergentmind]
3. 기존 메모리(HBM·DRAM·NAND)와의 비교
3-1. HBM과의 관계
- HBM은 DRAM 기술을 TSV 기반 3D 스택으로 구성해, 극도로 넓은 버스를 통해 대역폭을 확보하는 메모리다.wikipedia+2
- 스택당 용량은 수십~수백 GiB 수준에 머물지만, 지연이 매우 낮고, GPU/가속기 다이와 매우 근접 배치되어 지연·전력 측면에서 최적화되어 있다.microchipusa+1
- 반면 HBF는 NAND 기반이라 지연 및 쓰기 내구성 측면에서 HBM보다 열세지만, 스택당 1.6 TiB 이상, 향후 수 TB 이상까지 확장 가능한 압도적인 용량을 제공한다.tomshardware+2
업계에서는 HBF가 HBM을 완전히 대체하기보다는, 특히 AI 추론 환경에서 HBM을 보완해 “더 많은 모델·더 긴 컨텍스트·더 큰 배치”를 허용하는 보조 계층으로 쓰일 가능성이 크다고 본다.pulse.mk+2
3-2. DRAM/DDR 계열과의 비교
- DDR5와 같은 일반 DRAM은 범용 메인 메모리로, 지연은 수십 ns 수준이지만 대역폭은 채널당 수십 GB/s 정도로 HBM·HBF에 비해 낮다.microchipusa+1
- 또한 서버 보드나 GPU 보드에 실장 가능한 DRAM 수는 패키징·소켓 제약에 따라 엄격히 제한된다.[microchipusa]
- HBF는 DRAM보다 지연이 훨씬 크지만, “HBM급 대역폭 + DRAM보다 훨씬 큰 용량”이라는 장점을 가지고, 특히 읽기 중심의 AI 추론·데이터 분석 워크로드에서 효율적인 계층형 메모리 구성을 가능하게 한다.tomshardware+2
3-3. 기존 NAND/스토리지와의 비교
- 일반 SSD/플래시 카드는 수 µs~수십 µs 단위 지연과 수 GB/s 이하의 대역폭을 제공한다.[emergentmind]
- HBF는 같은 플래시 기반이지만, 인터페이스와 병렬성 설계를 바꿔 한 스택에서 수백 GB/s까지 끌어올리려 한다는 점에서, 사실상 “스토리지인 듯, 메모리인 듯한” 중간 형태다.tomshardware+1
- 비휘발성이라는 특성 때문에, 전원이 꺼져도 LLM 가중치나 모델 파라미터를 그대로 유지할 수 있어, 재시동 시 로딩 시간을 크게 줄이는 효과도 기대된다.tomshardware+1
4. 주요 플레이어와 산업 동향
4-1. SanDisk의 이니셔티브
- 2025년 2월, SanDisk는 고대역폭 플래시(HBF)를 공개하며, HBM 수준 대역폭과 3D NAND의 대용량을 결합한 새로운 메모리 아키텍처라고 소개했다.eenewseurope+1
- 첫 세대 HBF는 GPU에 최대 4 TB VRAM 용량을 제공할 수 있고, 이후 세대에서는 더 높은 용량을 예상한다는 언급이 있다.eenewseurope+1
- SanDisk는 HBF를 AI 추론용 가속기, 데이터센터 GPU, 나아가 스마트폰·엣지 디바이스까지 확장 가능한 기술로 포지셔닝한다.linkedin+2
SanDisk 분사 이후, 회사는 고대역폭 플래시와 같은 “디스럽티브 플래시 메모리 기술”을 핵심 전략 영역 중 하나로 내세우고 있다.[eenewseurope]
4-2. SK hynix와의 협력 및 표준화
- 2025년 8월, SanDisk와 SK hynix는 HBF 기술의 표준화를 위해 협력한다는 MOU를 체결했다.blocksandfiles+2
- SK hynix는 HBM 시장의 주요 선도 기업인 만큼, HBF를 HBM 생태계와 조화롭게 통합하는 데 중요한 역할을 할 수 있다.blocksandfiles+1
- 양사는 HBF의 인터페이스, 패키징 형태, 생태계 지원 방식 등을 산업 표준 수준으로 끌어올리는 것을 목표로, 주요 AI 고객사들과 함께 기술 자문위원회(Technical Advisory Board)를 구성하고 있다.blocksandfiles+1
이 협력 소식 이후 SanDisk 주가는 발표 전 43달러 수준에서 86달러까지 급등하는 등, 시장의 기대를 반영하기도 했다.[pulse.mk.co]
4-3. 기술 성숙도와 상용화 일정
- 여러 분석에서는 HBF가 여전히 개발 단계에 있으며, 상용 제품은 “몇 년 후”에나 본격 등장할 것으로 본다.blocksandfiles+2
- SanDisk는 2026년 하반기 고객 샘플 제공, 2027년 초 추론 AI에 특화된 버전 공급을 목표로 한다고 언급했다.[pulse.mk.co]
- 업계에서는 3D NAND 다이 스택의 복잡성, 발열 및 전력 관리, 패키징·테스트 비용 등으로 인해 “실제 양산 수준의 HBF가 완전히 자리 잡기까지는 꽤 시간이 걸릴 것”이라는 분석을 내놓는다.blocksandfiles+1
요약하면, HBF는 개념·프로토타입 단계에서 상당 부분 검증된 상태지만, 대량 생산과 폭넓은 채택까지는 중장기 로드맵이 필요한 기술로 평가된다.blocksandfiles+2
5. 장점, 한계, 활용 시나리오
5-1. 주요 장점
- 초대용량
- 스택당 1.6 TiB 수준, 향후 4 TB 이상도 가능하다는 전망이 있어, 기존 HBM 대비 8~16배 이상의 용량 우위를 확보할 수 있다.tomshardware+3
- 높은 대역폭
- 병렬화된 미니 어레이, 멀티 채널·way 인터리빙, HBM 스타일 인터페이스를 통해 스택당 수백 GB/s급 대역폭을 목표로 한다.tomshardware+2
- 비휘발성과 에너지 효율
- NAND 플래시는 전원 오프 상태에서도 데이터가 유지되므로, 모델 가중치나 데이터셋을 항상 온보드에 유지해 부팅·로드 시간을 줄이고, 스토리지‑메모리 계층 간 이동 비용도 절감할 수 있다.tomshardware+2
- 고도의 병렬화와 인터페이스 개선을 통해 바이트당 에너지를 기존 구조 대비 20~30% 절감하는 결과도 보고된다.[emergentmind]
- 비용 효율
- 3D NAND는 DRAM보다 비트당 비용이 훨씬 낮으므로, 같은 예산으로 더 큰 메모리 용량을 확보할 수 있다.tomshardware+1
5-2. 구조적 한계
- 지연과 쓰기 내구성
- 지연은 여전히 플래시 특성을 따라 ns 단위가 아닌 µs 단위이며, 쓰기 내구성도 DRAM과 비교해 제한적이다.pulse.mk+1
- 따라서 HBF는 빈번한 랜덤 쓰기보다는, 주로 “한 번 적재한 모델·데이터를 반복적으로 읽는” 워크로드에 적합하다.tomshardware+1
- 설계 복잡도·발열
- 다중 레이어의 3D NAND 위에 다시 다이 스택을 더하고, 수백~수천 핀의 고속 인터페이스를 구성해야 하므로 패키징·테스트·수율 관리가 매우 복잡해진다.blocksandfiles+1
- 스택당 수십 와트에 달하는 전력 소비와 발열을 처리하기 위한 열 설계도 쉽지 않다.blocksandfiles+1
- 생태계·표준화 문제
- HBM과 달리, 아직 JEDEC 수준의 표준이 확립된 단계는 아니며, 컨트롤러·인터페이스·툴체인 등 생태계 구축이 진행 중이다.blocksandfiles+2
5-3. 예상 활용 시나리오
- LLM 추론 가속기
- 수천억~수조 파라미터 모델의 가중치를 HBF 상에 직접 적재하고, HBM은 활성 토큰 상태·KV 캐시 등 시간 민감 데이터에 집중하는 계층형 메모리 구성이 유망하다.tomshardware+2
- 멀티모달·장문 컨텍스트 AI
- 텍스트·이미지·영상까지 포괄하는 멀티모달 모델과 수십만 토큰 이상의 장문 컨텍스트를 처리하려면, 현 세대 HBM 용량만으로는 부족한데, HBF가 이 “컨텍스트 버퍼” 역할을 맡을 수 있다.pulse.mk+2
- 데이터 분석·검색 가속기
- 대규모 인덱스·벡터 데이터베이스 등, 큰 데이터셋을 상시 온보드에 유지하면서 초고속 랜덤 읽기를 요구하는 워크로드에 적합하다.[emergentmind]
- 엣지·모바일 디바이스
- 장기적으로는 스마트폰·엣지 장비에서, 로컬 AI 모델을 수백 GB~수 TB 단위로 탑재하는 시나리오도 제시된다.linkedin+2
요약하면, HBF(고대역폭 플래시)는 “HBM 같은 대역폭”과 “플래시 같은 초대용량·비휘발성·비용 효율”을 결합한 새로운 메모리/스토리지 계층으로, 특히 LLM·AI 추론 시대의 메모리 병목을 풀 핵심 후보 중 하나다. 아직 상용화 초기 단계지만, SanDisk–SK hynix를 중심으로 표준화와 생태계 구축이 진행되고 있어, 향후 AI 인프라 및 고성능 컴퓨팅 아키텍처의 중요한 축으로 성장할 가능성이 크다.blocksandfiles+5