AI 데이터 센터용 광섬유 케이블 네트워크: 높은-성능 최적화 가이드

1. 광섬유 케이블이 AI 데이터센터에 적합한 기반인 이유

현대 AI 인프라의 맥락에서 광섬유 케이블은 구리 대안이 사라졌기 때문이 아니라 대역폭, 도달 범위, 지연 시간 안정성 및 EMI 내성에 대한 누적 수요로 인해 구리가 AI 클러스터 규모에서 해결할 수 없는 복합적인 기술적 사례를 생성하기 때문에 대규모 데이터 센터-의 기본 상호 연결 매체가 되었습니다.

AI 훈련 워크로드, 특히 대규모 언어 모델은 모든 훈련 단계에서 그래디언트 매개변수를 교환해야 하는 수천 개의 GPU에 계산을 분산시킵니다. 널리 인용되는 한 업계 추정에 따르면 네트워크 지연 시간은 대규모 분산 실행에서 전체 실제 벽시계 교육 시간의 약 20~30%를 차지할 수 있습니다.¹ 수백만 달러의 비용이 드는 단일 교육 캠페인을 사용하면 약 10m의 과잉 광섬유에 해당하는 50ns의 피할 수 있는 지연 시간-도 측정 가능한 재정적 무게를 지닙니다.- 구리 전송은 이러한 환경에서 요구하는 대역폭, 도달 범위 또는 확장성을 충족할 수 없습니다.

1.1 광학-최초 설계를 이끄는 네 가지 속성

재산	AI 패브릭이 중요한 이유	구리 등가물
대역폭 밀도	단일-모드 광섬유는 광섬유 쌍당 100G~1.6T를 전달합니다. 병렬 MPO 트렁크는 도관 재-당김 없이 선형적으로 포트 밀도를 확장합니다.	매우 짧은 거리에서 최대 400G까지 가능
대기 시간 안정성	GPU는 모두{0}}링크당 지연 시간이 포드에 따라 다를 때{1}}작업 비동기화를 줄입니다. 광섬유 경로의 길이는 미터 수준에서-일치될 수 있습니다.	DAC 어셈블리의 길이는 고정되어 있어 넓은 공간에 맞추기가 어렵습니다.
EMI 내성	고밀도 랙(30~100kW)은 다중 랙 규모에서 구리 신호를 손상시키는 심각한 전자기 잡음을 생성합니다.-	차폐가 필요하고 케이블 직경과 무게가 증가합니다.
비트당 전력	단일 800G OSFP 다중 모드 트랜시버는 일반적으로 동급 단일-모드보다 1~2W 더 적게 소비합니다[2]. 참조 클러스터당 768개 트랜시버에서 절감 효과는 연속 약 1.5kW에 이릅니다.	800G의 액티브 DAC 또는 AOC는 도달 이점 없이 비슷한 전력을 사용합니다.

2. 올바른 광케이블 유형 선택: OM3, OM4, OM5 및 OS2 비교

광섬유 유형 결정에 따라 향후 15~20년 동안의 모든 속도 업그레이드에 대한 상한선이 설정됩니다. 유리는 트랜시버나 스위치보다 훨씬 오래 지속됩니다. 오늘 잘못된 등급을 선택하면 속도가 올라갈 때-반발을 의미합니다. 전체 의사결정 프레임워크는 다음과 같습니다.

우리의실내 광섬유 케이블 제품군OM4, OM5 및 OS2 옵션을 다룹니다. 아래 선택 기준은 공급업체에 관계없이 적용됩니다.

2.1 전체 비교 매트릭스

섬유	핵심	재킷	400G 도달	800G 도달	최고의 사용 사례
OM3	50 µm	아쿠아	~70m(SR8)	권장되지 않음	기존 버전만 - 새 빌드에서는 피하세요.
OM4	50 µm	아쿠아	~100m(SR8)	~60m(SR8)	내부-GPU-~-리프; 가장 비용 효율적-<100 m
OM5	50 µm	라임 그린	~150 m	~100 m	미래를 보장하는-멀티모드; 1.6T에 대한 SWDM 파장 다중화 지원
OS2(SM)	9 µm	노란색	2km 이상(FR4)	2km 이상(2xFR4)	Spine links, inter-building, DCI - anywhere >100 m

비용 참고 사항:OS2 광섬유 비용은 미터당 OM과 거의 동일합니다.4 - 비용 차이는 전적으로 트랜시버에 있습니다. 단일-모드에는 DFB 레이저가 필요합니다. 다중 모드는 더 저렴한-비용의 VCSEL을 사용합니다. GPU-에서-리프까지 100m 미만에서 실행되는 경우 거의 모든 시나리오에서 멀티모드가 $/port에서 승리합니다.

2.2 30초 광섬유 선택 규칙

대본	권장섬유	이론적 해석
< 100 m, high density, cost-sensitive	OM4 + MPO-12/16 병렬 광학 장치	최고의 $/포트; 현재 대부분의 GPU{0}}~-리프 실행을 다루고 있습니다.
< 150 m, planning beyond 800G	OM5(15~25% 프리미엄을 한 번 지불)	케이블을 다시 당기지 않고도 향후 1.6T용 SWDM 지원-
>150m, 척추 또는 건물 간 링크-	LC 듀플렉스 또는 MPO-12를 갖춘 OS2	단일{0}}모드는 이러한 거리에서 실행 가능한 유일한 옵션입니다.
랙 내-, < 5m	DAC 구리	최저 대기 시간 및 비용 구리가 도달할 수 없는 곳을 위한 예비 섬유

OM5 광대역 다중 모드 사양은 다음을 참조하세요.ANSI/TIA-568.3-E(OM5는 공식적으로 5절에서 WBMMF로 정의됩니다.)

3. 커넥터 및 극성: MPO-12, MPO-16, MTP 및 Type-B와 Type-C 비교에 적합

링크 속도가 400G를 초과하면 거의 모든 연결이 병렬이 됩니다. - 여러 광섬유 레인이 전체 신호의 일부를 전달합니다. 이 시점에서 커넥터와 극성은 광섬유 품질이나 경로 길이 문제에 앞서 현장 오류의 주요 원인이 됩니다.

3.1 MPO 대 MTP - 실용적인 차이점

MPO(다중-광선 푸시-켜기)는 다중-광선 커넥터에 대한 기본 IEC 61754-7/TIA 표준입니다. MTP®는 US Conec의 엔지니어링 구현으로 - 더 엄격한 기계적 공차, 플로팅 페룰 및 일반적으로 더 낮은 삽입 손실을 구현합니다. 모든 MTP 커넥터는 MPO{10}}호환입니다. 모든 MPO 커넥터가 MTP 사양을 충족하는 것은 아닙니다. 400G 이상의 경우 낮은-손실 MTP Elite(또는 동급)를 지정합니다. 삽입 손실 목표는 결합 쌍당 0.35dB 이하입니다. 전체 MTP 제품 세부 정보는 US Conec MTP 제품 페이지에서 확인할 수 있습니다.

Glory Optics는 400G 및 800G 애플리케이션에 대해 결합 쌍당 0.35dB 이하로 인증된 다양한 MTP/MPO 어셈블리 및 트렁크를 공급합니다.

3.2 섬유 개수 - MPO-8, MPO-12, MPO-16, MPO-24

커넥터	활성 레인	일반적인 속도	주요 내용
MPO-8	4 전송 + 4 수신	100G-SR4, 400G-DR4	단순한; 널리 지원됨; 여분의 섬유 없음
MPO-12	8 활성 + 4 미사용	100G / 200G / 400G (SR8, DR4)	최신 배포를 위한 Workhorse 커넥터
MPO-16	8 Tx + 8 Rx(모두 활성)	800G-SR8 / DR8	사실상의-800G 표준 -은 16개 광섬유를 모두 적극적으로 사용합니다.
MPO-24	24	트렁크/브레이크아웃	고밀도 마이그레이션 트렁크;- 2× MPO-12 또는 3× MPO-8로 나뉩니다.

3.3 극성 관리: 링크 실패의 주요 원인

극성 불일치가 주요 원인입니다.'링크가 안올라가네요'AI 패브릭 티켓. 세 가지 극성 방법은 TIA-568.3-E에 정의되어 있습니다.

극성 유형	기구	권장 용도
A 유형(직선{0}})	한쪽 끝의 광섬유 1은 다른 쪽 끝의 광섬유 1에 연결됩니다.	새 빌드에서는 거의 사용되지 않습니다. 레거시 전용
B형(쌍이 뒤집혀 있음)	키-최대 키-최대 짝짓기; 쌍은 끝-에서-끝으로 교체됩니다.	40G~400G 배포를 위한 주요 선택
유형 C(쌍 반전 + 키 회전)	키-최대 키-다운; 이중-쌍 교환 모듈과 함께 사용	800G 병렬광학(SR8, DR8)의 표준으로 부상

3.4 APC 대 UPC End-Face - 1.6T 준비에 중요한 이유

800G 단일{1}}모드 링크에는 DFB 레이저 안정성을 저하시키는 임계값 미만으로 역반사를 억제하기 위해 점점 더 APC(8도 각도의 물리적 접촉) 커넥터가 필요합니다. UPC 커넥터는 다중 모드 링크 및 더 짧은 단일{5}}모드 실행에 작동하지만 OSFP 2xFR4 모듈 - 및 1.6T - APC를 대상으로 하는 모든 항목의 경우 올바른 사양입니다.중요: APC를 UPC 커넥터에 결합하지 마십시오.그렇게 하면 광학적 충돌이 발생하고 링크를 중단하기에 충분한 6~10dB의 삽입 손실-이 발생합니다.

4. 네트워크 아키텍처: 프런트엔드와 백엔드, 리프-스파인 및 DGX 참조 디자인

모든 AI 데이터 센터는 트래픽 패턴과 성능 요구 사항이 근본적으로 다른 두 개의 논리적으로 구별되는 네트워크를 운영합니다.

초기-세대 AI 클러스터 빌드(2022~2023)는 이러한 차이를 자주 과소평가하여 범용-용도 프런트엔드-인프라-를 통해 GPU 집단 트래픽을 라우팅하여 지속적으로 학습 성능 저하와 대역폭 경합을 초래했습니다. 엄격한 논리적 분리와 물리적 분리를 유지하는 것은 2026년 배포의 표준 설계 요구 사항입니다.

4.1 프론트엔드와 백엔드 살펴보기

기인하다	프런트엔드 네트워크	백엔드 AI 패브릭
교통 패턴	남북-: 사용자 API 트래픽, 저장, 관리	동-서: 전체-감소, 경사 동기화, 집단 커뮤니케이션
토폴로지	3-계층 또는 리프-스파인 이더넷	레일-최적화된 리프-척추; 종종 InfiniBand NDR/XDR
링크 속도(2026)	25G – 400G	현재 400G – 800G; 2026~27년부터 1.6T 배포
섬유 밀도와 기존 DC 비교	1x 기준선	4~5배(Wesco, 2024) ~ 10배(코닝, 2024) [3]
케이블링 스타일	교차-연결을 통한 구조화된 케이블링	GPU를-지정하여-리프 사전 종료-MPO로 보내는 경우가 많습니다. 최소한의 교차-연결

4.2 레일-최적화된 리프-스파인 아키텍처

NVIDIA의 DGX 참조 디자인은 서버 내의 각 GPU를 전용 GPU에 할당합니다."레일"- Pod에 있는 모든 서버의 GPU 0은 동일한 리프 스위치에 연결됩니다. GPU 1부터 다음 리프까지 등등. 이 패턴은 단일 리프에서 핫 집단-통신 트래픽(모두{5}}감소)을 유지하고 AI 훈련 시간을 지배하는 작업의 홉 수를 줄입니다. 케이블링의 경우 이는 단일 DGX 서버의 8개 GPU가 8개의 서로 다른 리프 스위치로 팬아웃됨을 의미합니다. - MPO 트렁크 계획은 해당 토폴로지를 정확하게 미러링해야 합니다. 전체 참조 아키텍처 세부 정보는 다음에서 확인할 수 있습니다.NVIDIA DGX H100 시스템 아키텍처 가이드.

4.3 구조적 케이블링이 여전히 규모에서 승리하는 이유

GPU 서버와 리프 스위치 사이의 직접{0} 연결 패치 코드는 홉 지연 시간을 최소화하지만 수백 개의 GPU를 초과하면 운영상 관리가 불가능해집니다. 최대 1,000개의 GPU를 초과하는 클러스터의 경우, 1U 하우징에 카세트 기반 패치 패널이 포함된 사전 -종단 처리된 MTP 트렁크가 밤새 케이블 연결 작업 없이-이동-이동, 추가 및 변경을 지원하는 유일한 아키텍처입니다. Corning EDGE, Leviton e2XHD, CommScope HD8 등 특수 목적으로 구축된 시스템은 이 패턴에 대해 현장에서 검증된 플랫폼입니다.{13}}

우리의광섬유 패치 패널이 제품군은 고밀도 데이터 센터 환경을 위해 설계되었으며{0}}카세트 기반 MTP/MPO 종료를 지원합니다.

5. 손실 예산 수학: 0.5dB가 훈련 실행을 종료할 수 있는 이유

모든 광 링크는 트랜시버 사양에 따라 설정된 한정된 전력 예산 내에서 작동합니다. 광섬유, 커넥터 및 스플라이스의 삽입 손실로 인해 해당 예산이 소비됩니다. 누적된 손실이 예산을 초과하면 링크는 훈련에 실패하거나 오류를 숨기지만 추가 트랜시버 전력과 열을 소비하는 과도한 FEC 모드 -에서 작동합니다.

5.1 400G 및 800G의 기준 손실 예산

기준 치수	최대 도달 범위	총예산	일반적인 채널 손실(2 MTP + 광섬유)	사용 가능한 마진
400G-SR8(OM4)	100 m	~1.9dB	0.3dB 파이버 + 2 × 0.35dB MTP=1.0dB	~0.9dB
400G-DR4(OS2)	500 m	~3.0dB	0.2dB 파이버 + 2 × 0.35dB MTP=0.9dB	~2.1dB
800G-SR8(OM4)	60–100 m	~1.6dB	0.25dB 파이버 + 2 × 0.35dB MTP=0.95dB	~0.65dB - 매우 빡빡함
800G-DR8(OS2)	500 m	~2.7dB	0.2dB 광섬유 + 2 × 0.35dB APC-MPO=0.9dB	~1.8dB

주요 통찰력:800G-SR8에서는 단일 더티 엔드-면(0.3~0.5dB 추가 가능)이 사용 가능한 마진의 46~77%를 소비합니다. 실제로 리프 스위치 패치 패널에 있는 하나의 오염된 커넥터라도 체계적 검사가 결함을 격리하기 전에 총 학습 처리량을 상당히 줄일 수 있습니다-. 이것이 바로 선도적인 운영자가 이제 단면 검사를 선택적인 품질 검사가 아닌 시운전의 게이트 승인 단계로 취급하는 이유입니다-.

5.2 손실 예산 계산 템플릿

설치를 승인하기 전에 다음 구조를 사용하여 채널 손실 예산을 문서화하세요.-

손실요소	값(dB)	메모
섬유 감쇠(OM4)	0.003 × 길이(미터)	예: 100m=0.3dB
MTP 커넥터(각 결합 쌍)	최대 0.35dB	800G의 경우 MTP Elite를 지정하십시오. 표준 MPO는 0.5~0.75dB일 수 있습니다.
채널의 커넥터 쌍 수	일반적으로 2~4	모든 패치 패널 및 카세트 연결을 계산합니다.
접속 손실(해당하는 경우)	스플라이스당 0.1dB	OSP 실행에만 해당됩니다. 구조화된 케이블링의 스플라이스 방지
총 채널 손실	위의 합계	트랜시버 사양과 비교하십시오. 목표 마진 15~20%
설계 목표(800G-SR8)	1.3dB 이하	커넥터 마모 및 온도 드리프트에 대비한 여유 공간 확보

6. 케이블 관리, 배포 및 테스트

6.1 사전-종료 대 현장-종료 - 각각의 정당성이 입증된 경우

요인	사전-종료된 MTP 트렁크	현장 접합
설치 속도	통제된 환경에서는 훨씬 더 빠릅니다. Corning EDGE 시스템 문서에서는 설치 시간이 40~70% 단축되었다고 언급합니다 [3]	더 느리게; 각 종료에는 숙련된 노동력과 치료 시간이 필요합니다.
삽입 손실 일관성	공장에서-광택 처리됨; 어셈블리별로 문서화 및 인증됨	변하기 쉬운; 기술자의 기술과 환경에 따라 다름
최고의 사용 사례	경로 길이가 알려진 모든 GPU-~-리프 및 리프-~-스파인 실행	정확한 길이를 미리 결정할 수 없는 -빌딩 OSP 실행-
비용 고려	더 높은 부품 비용; 규모에 따른 인건비 절감	부품 비용 절감 인건비 및 재작업 위험 증가

의미 있는 규모의 GPU 클러스터의 경우 사전에 종료된 어셈블리가-기본값입니다. 현장 접합은 외부-공장 가동에서만 유지됩니다.

6.2 10배 섬유 밀도에서의 케이블 관리

최소 굽힘 반경 유지:부하 시 케이블 직경은 10배, 설치 중에는 20배입니다. BIF(Bend{3}}Insensitive Fiber)는 더 좁은 회전을 허용하지만 패치 패널의 날카로운 모서리에 대한 라이센스는 아닙니다.

열기 통로와 냉기 통로를 분리합니다.오버헤드 트렁크 번들은 열기 통로에서 CRAH 장치로의 환기 공기 흐름을 방해해서는 안 됩니다. - 이는 높은 GPU 랙 밀도에서 흔히 발생하는 열 관리 실패 모드입니다.

설치 전 모든 끝에 라벨을 붙입니다.양쪽 끝에 라벨이 없는 파이버 런은 향후 문제 해결 문제가 진행 중입니다.

레일 및 포드별 색상-코드:따라서 시간 압박 사고가 발생하는 동안 문서를 참조하지 않고도 움직임을 시각적으로 확인할 수 있습니다.-

6.3 4개-계층 테스트 프로토콜

체계적인 승인 테스트는 선택 사항이 아닙니다. - 이를 건너뛰면 지속적으로 결함 발견이{1}}프로덕션으로 전환되며, 여기서 다운타임 비용은 테스트 자체 비용을 훨씬 초과합니다.

층	테스트 유형	방법/표준	무엇을 잡는가
1등급	육안/끝-면 검사	IEC 61300-3-35에 따른 광섬유 범위; 필요한 경우 청소하고 다시 검사하십시오.	오염, 긁힘, 칩 - 마진 손실의 가장 큰 원인
2단계	삽입 손실 + 극성	IEC 61280-4-1에 따른 원으로 둘러싸인-플럭스 OLTS, 극성 확인을 위한 VFL	손실 초과, 극성 불일치, 잘못된 케이블 라우팅
3단계	OTDR(오류만-)	손실이 사양을 벗어난 경우 Fluke OptiFiber Pro 또는 Viavi T-BERD	오류 위치를 정확히 찾아냅니다: 커넥터, 스플라이스, 매크로벤드 또는 파손
4단계	실시간 트래픽 검증	NCCL은 참조 포드에 대한{0}}모두 감소 벤치마크(nccl-테스트)를 수행합니다.	물리적 계층이 애플리케이션{0}}수준 대역폭 기준을 제공하는지 검증합니다.

데이터 센터에 대한 OTDR 테스트 방법은 IEC 61280-4-4에 자세히 설명되어 있습니다. NCCL 벤치마크 문서는 다음 위치에서 유지됩니다.NVIDIA NCCL 테스트 GitHub.

7. 400G에서 800G로의 마이그레이션 플레이북

대부분의 운영자는 신개발 분야가 아닙니다. 현재 그들은 400G를 실행하고 있으며 800G GPU 세대를 배포해야 한다는 압력에 직면하고 있으며 기존 광케이블 공장을 보존하는 마이그레이션 경로가 필요합니다. 다음의 단계별 접근 방식은 여러 대규모 마이그레이션 프로젝트에서 관찰된 배포 패턴을 반영합니다.-

7.1 6-개월 단위 마이그레이션 일정

단계	타이밍	주요 활동	위험 관리 조치
1. 감사 및 계획	1개월	기존 OM4/OS2 플랜트 재고 파악 MPO-12와 MPO-16 격차를 식별합니다. 20% 예비 트렁크 재고를 주문합니다. 광학 조달 전 아키텍처 동결	광학 제품 주문 전 아키텍처 동결 주문 후 - 변경 사항에 대해 4~8주의 리드 타임 위약금 발생
2. 연구실 상호 운용성	2개월	Interop은 모든 광학/스위치 조합을 테스트합니다. PFC 및 ECN 설정을 검증합니다. 참조 포드에서 기본 NCCL 모두-감소	실험실에서 수정하는 데 드는 비용 ≒ 프로덕션에서 수정하는 데 드는 비용의 10% - 이 단계에서 자체적으로 비용을 지불합니다.
3. 척추 업그레이드	2~3개월	스파인 스위치를 먼저 업그레이드하십시오. 처음에는 400G 호환 모드에서 실행합니다. 800G→2×400G 브레이크아웃 케이블을 사용하여 오래된 리프 스위치 연결	브레이크아웃 케이블은 마이그레이션 기간 동안 CAPEX를 최대 40%까지 줄입니다. 롤백 보존
4. 잎 이동	4~5개월	리프 스위치 새로 고침; 서버 NIC 업그레이드; 800G-SR8 포트에 필요한 경우 MPO-12개 트렁크를 MPO-16으로 교체	포드당 마이그레이션 후- 30일 동안 400G 롤백 경로 유지
5. 생산 컷오버	6개월	모든 링크를 800G 최고 속도로 전환합니다. 다시-기준 NCCL 모두-감소; 새로운 속도를 위해 FEC/PFC 조정	전체 공장에 대해 Tier 1 및 Tier 2 승인이-승인된 후에만 가동 시작-

8. 1.6T 준비: 아키텍처, 파이버 및 타임라인

1.6T 이더넷은 이론적인 로드맵 항목이 아닙니다.IEEE 802.3dj- 멀티모드 및 단일{2}}모드 광섬유에 대한 1.6T를 관리하는 표준-은 비준을 향해 진행 중이며 2026년에 최종 승인에 도달할 것으로 예상됩니다. 주요 공급업체의 첫 번째 1.6T 트랜시버 샘플은 이미 고객 평가 중입니다. 이 섹션에서는 다음 빌드 전에 지금 결정해야 할 사항을 다룹니다.

8.1 트랜시버 형식 및 도달 목표

모듈 형식	섬유 종류	목표 도달범위	차선 구조	주요 종속성
1.6T-SR16	OM4 또는 OM5	50–100 m	16 × 100G VCSEL 레인(MPO-32)	OM5가 강력히 선호됩니다. OM4 도달 범위는 50m로 제한될 수 있습니다.
1.6T-DR16	OS2	500 m	16 × 100G SMF 레인	APC 커넥터가 필요합니다. 스위치 ASIC의 200G-레인 SerDes
WDM(OM5)을 통한 1.6T	OM5	100–150 m	4파장 × 400G SWDM	OM5는 이 밀도에서 SWDM을 지원하는 유일한 다중 모드 광섬유입니다.
CPO(공동-패키지 광학 제품)	OS2 또는 OM5	랙-에서-랙으로	실리콘 패키지를 전환하기 위한 광섬유 직접 연결	스위치 전면에 전용 광섬유 경로가 필요합니다. 플러그형 트랜시버 없음

8.2 1.6T 준비를 위해 오늘 내려야 할 4가지 인프라 결정

ASIC 선택 전환:200G-레인 SerDes 기능이 있는 ASIC 선택. 100G-레인 ASIC(대부분의 최신 400G/800G 플랫폼에 사용)은 전체 실리콘 교체 없이는 1.6T를 지원할 수 없습니다. 이는 나중에 취소할 가장 높은-비용 결정입니다.

섬유 공장 - OM5 또는 OS2로 이동:OM4는 표준 범위에서 지배적인 1.6T 다중 모드 트랜시버 형식(SR16, SWDM 변형)을 지원하지 않습니다. 24~36개월 내에 업그레이드될 랙을 위해 오늘 새 광케이블을 가져오는 경우 OM4에 비해 OM5의 증분 비용은 일반적으로 광케이블 품목의 15~25%입니다. -향후 재수입의 일부-입니다.

SR16용 커넥터 계획 - MPO-32:1.6T-SR16에는 물리적 수준에서 MPO-12 또는 MPO-16과 역호환되지 않는 MPO-32 커넥터가 필요합니다. 이에 따라 경로와 패널 밀도를 계획하십시오. MPO-32에서 2×MPO-16으로의 브레이크아웃이 지배적인 마이그레이션 전환 케이블이 될 것입니다.

CPO 경로 예약:함께 패키지된 광학 장치는 플러그형 트랜시버를 제거하고 광섬유를 스위치 ASIC 패키지로 직접 라우팅합니다. 2027+ 플랫폼용 랙 설계의 스위치 전면에 200~400mm의 방해받지 않는 수평 통로 공간을 남겨두세요. 밀집된 포드에 이 공간을 소급하여 생성하는 것은 운영상 비용이 많이 듭니다.

8.3 1.6T 준비 체크리스트

인프라 요소	1.6T 준비됐나요?	준비되지 않은 경우 조치
섬유 유형: OM5 또는 OS2	예	조치가 필요하지 않습니다.
섬유 유형: OM4	부분	SR16 실행을 위한{0}}풀링 계획 SWDM은 지원되지 않습니다.
섬유 유형: OM3	아니요	다음 업그레이드 주기 전에 교체
스위치 ASIC: 200G-레인 SerDes	예	조치가 필요하지 않습니다.
스위치 ASIC: 100G-레인 SerDes	아니요	ASIC 갱신을 계획합니다. 소프트웨어를 업그레이드할 수 없습니다
MPO-16 트렁크 설치됨	부분	2×MPO-16 브레이크아웃을 통해 1.6T로 연결됩니다. 12~24개월 동안 허용됨
MPO-32 경로 계획됨	예	조치가 필요하지 않습니다.
OS2의 APC 커넥터가 실행됩니다.	예	조치가 필요하지 않습니다.
예비 포트 용량 리프/스파인에서 20% 이상	예	조치가 필요하지 않습니다. AI 클러스터 성장은 비선형적입니다-
스위치 페이스에 예약된 CPO 경로 공간	예	조치가 필요하지 않습니다.

9. ROI 및 TCO: 섬유 투자 사례 만들기

라인 항목은 표시되고 회피 비용은 표시되지 않기 때문에 광케이블 인프라 프로젝트가 CAPEX 승인 단계에서 차단되는 경우가 있습니다. 전체 TCO 관점에서는 이러한 결론이 일관되게 반전됩니다.

9.1 5가지 TCO 항목

TCO 카테고리	운전사	크기의 순서
CAPEX - 광섬유 + 커넥터	1회- 포트 수와 경로 복잡성에 따라 확장	일반적으로 총 클러스터 구축 비용의 5% 미만
CAPEX - 광학	주요 비용 동인 800G OSFP 광학은 400G보다 실질적으로 더 높습니다.	포트별로-별도로 예산을 계획하세요. 가격은 매년-전년에 걸쳐-의미 있는 비율로 하락하고 있습니다(LightCounting 또는 Cignal AI로 현재 가격 확인).
OPEX - 전력(트랜시버)	멀티모드는 동급 단일-모드에 비해 트랜시버당 1~2W를 절약합니다. [2]	768포트 기준 클러스터당 최대 1.5kW 연속; ~130MWh/년
OPEX - 냉각	트랜시버 전력 델타에 정비례	~1.3× 트랜시버 전력 절감(PUE 효율 계수)
OPEX - 가동 중지 시간 방지	사전-종단 처리된 모듈식 카세트로 MTTR이 눈에 띄게 감소합니다.	모듈식 구조의 케이블 연결은 배포 후 검토에서 직접 패치 배포에 비해 -오류 해결 시간이 더 낮다는-일관적인 결과를 보여줍니다. 프로젝트-특정 수치는 자체 MTTR 데이터를 기준으로 삼아야 합니다.

9.2 참조 ROI 계산 템플릿

다음 구조는 자체 TCO 사례를 구축하기 위한 시작 프레임워크를 제공합니다. 실제 값은 클러스터 크기, 지역 에너지 비용 및 SLA 구조에 따라 달라집니다.

변하기 쉬운	예시 값	당신의 가치
총 트랜시버 포트 수	10,000개 포트
포트당 절전(MM 대 SM)	1.5 W
전체 절전(지속)	15,000W=15kW
연간 에너지 비용(@ $0.08/kWh)	15kW × 8,760시간 × $0.08=$10,512/년
냉각 승수(PUE ~1.3)	$10,512 × 1.3=$13,666/년 총 회피 비용
증분 CAPEX(최적화 및 최소-실행 가능한 빌드)	다양함; 일반적으로 10K-포트 빌드의 경우 $150,000~$500,000 범위입니다.
예상 투자 회수 기간	14~20개월(관측 범위, 2023~2025 프로젝트 - 에너지 및 광학 비용 가정에 대해 확인)
SLA 크레딧 회피(예상)	프로젝트-특정; 1 대규모 중단 방지 ⇒ $50,000~$500,000

현재 트랜시버 가격 벤치마크는 다음을 참조하세요.LightCounting 시장 조사또는Cignal AI 광학 부품 보고서. 이는 분기별로 업데이트되며 광학 TCO 모델링을 위한 업계-표준 소스입니다.

10. RFP 및 설계 문서에서 참조할 표준

조달 문서에 올바른 표준을 인용하는 것은 관료적 오버헤드가 아닙니다. - 이는 공급업체 제출이 비교 가능하고 납품된 플랜트를 객관적인 기준에 따라 검증할 수 있도록 하는 메커니즘입니다.

기준	범위	RFP 기능	링크
TIA-942-C	데이터 센터 통신 인프라; 등급 1~등급 4 등급	기준 안정성 계층 및 케이블 연결 경로 요구 사항 설정	TIA-942-C
ANSI/TIA-568.3-E	광섬유 케이블링 및 구성 요소; OM4/OM5/OS2 정의	최소 커넥터 성능 및 테스트 승인 기준을 정의합니다.	TIA-568.3-E
ISO/IEC 11801-5	데이터 센터용 일반 케이블링(TIA-942 배선 부록과 동등한 국제적 수준)	미국 외 조달에 필요합니다.- EMEA 규제 표준에 부합	ISO/IEC 11801-5
IEEE 802.3df(2024)	다중 모드 및 단일{3}}모드 광섬유를 통한 200G/400G/800G 이더넷	트랜시버 상호 운용성 요구 사항을 인용합니다. SR8/DR8 광학 사양을 관리합니다.	IEEE 802.3df
IEEE 802.3dj(2026, 진행 중)	AI 패브릭용 FEC 프로필 및 전원 사양을 포함한 1.6T 이더넷	1.6T- 지원 인프라 제공물에 대한 향후 요구 사항으로 인용	IEEE 802.3dj
IEC 61300-3-35	광케이블 끝-면 육안 검사 허용 기준	Tier 1 승인 테스트를 위한 필수 참조입니다. 통과/실패 영역 지정	IEC 61300-3-35
IEC 61280-4-1	설치된 광섬유 링크에 대한 삽입 손실 측정 방법	Tier 2 OLTS 승인을 위한 필수 테스트 방법론 둘러싸인-플럭스 규정 준수 보장	IEC 61280-4-1

RFP에 지정할 디자이너 자격 증명: 빅시 RCDD(Registered Communications Distribution Designer)는{0}}북미 지역의 사실상 케이블링 설계 자격증입니다. BICSI DCDC는 데이터 센터의 특수성을 추가합니다. EMEA의 경우 CNet CDCP/CDCS/CDCE가 인정받는 진보적 인증 경로입니다.

11. 자주 묻는 질문

기술적인 질문

Q: MPO와 MTP 커넥터의 차이점은 무엇입니까?

A: MPO는 IEC/TIA 다중-파이버 푸시-온 커넥터 표준(IEC 61754-7)입니다. MTP®는 더 엄격한 공차, 플로팅 페룰 및 더 낮은 삽입 손실을 갖춘 US Conec의 엔지니어링 구현입니다. 모든 MTP는 MPO-와 호환됩니다. 모든 MPO가 MTP 사양을 충족하는 것은 아닙니다. 400G 이상의 경우 저손실 MTP Elite(결합된 쌍당 0.35dB 이하)를 지정하여 예산이 전체 1.6dB만큼 엄격한 800G에서 마진을 보존합니다.{13}}

Q: 800G에는 어떤 극성 유형을 사용해야 합니까?

A: 400G까지는 Type{0}}B가 지배적인 선택이었습니다. 800G 병렬 광 모듈(SR8, DR8)의 경우 Type-C가 해당 트랜시버 아키텍처에 필요한 이중-쌍 반전을 올바르게 처리하므로 표준으로 떠오르고 있습니다. BOM, 패치 패널 라벨 및 승인-테스트 체크리스트에 극성 유형을 문서화하세요. - 극성 불일치는 복구 가능하지만 프로덕션에서 발견되면 디버그 시간이 4~8시간 소모됩니다.

Q: 400G 및 800G에서 OM4 광섬유의 최대 거리는 얼마나 됩니까?

A: 400G-SR8 병렬 광학 장치의 경우 OM4는 최대 100m를 지원합니다. 800G-SR8의 경우 OM4 도달 범위는 특정 트랜시버 구현 및 채널 손실 예산에 따라 60~100m로 떨어집니다. 처음부터 800G용으로 설계하는 경우 더 엄격한 손실 예산을 고려하고 MTP Elite 커넥터를 지정하여 800G-SR8/OM4 채널에서 사용 가능한 ~0.65dB의 마진을 보존하세요.

Q: DAC, AOC 또는 트랜시버와 구조화된 광섬유를 언제 사용해야 합니까?

A: DAC(직접-구리 연결): 5m 미만의 랙 내부 실행에 사용됩니다. 최저 비용, 최저 대기 시간, 광학 장치가 필요하지 않습니다. AOC(액티브 광 케이블): 업그레이드 가능성보다 플러그 앤 플레이 단순성이 더 중요한 5~30m 내부-행 실행에 적합합니다. 트랜시버 + 구조화된 광섬유: 다른 모든 곳에서 사용하세요. 이는 의미 있는 거리를 지원하고, 케이블을 다시 당기지 않고도 광학 업그레이드를 허용하고, 작동상 수백 포트 이상으로 확장할 수 있는 유일한 솔루션입니다.

Q: 800G 링크에 대해 허용 가능한 삽입 손실은 얼마입니까?

답변: OM4의 800G-SR8의 경우 종단{4}}대-채널 예산은 약 1.6dB입니다. 플랜트 수명 동안 커넥터 마모, 온도 드리프트 및 청소 성능 저하를 고려하여 1.3dB 이하 - 15~20% 헤드룸을 목표로 설계합니다. 링크를 수락하기 전에 항상 IEC 61280-4-1 방법론에 대해 OLTS를 사용하여 검증하십시오.

Q: AI 데이터 센터에서는 InfiniBand 또는 이더넷을 사용합니까?

A: 둘 다 현재 프로덕션에서 사용되고 있습니다. NVIDIA의 레퍼런스 백엔드 패브릭은 InfiniBand NDR(400G) 또는 XDR(800G)을 사용합니다. 많은 하이퍼스케일러는 PFC(우선순위 흐름 제어) 및 ECN(명시적 혼잡 알림) 튜닝을 통해 비슷한 속도로 이더넷- 기반 RoCEv2를 실행합니다. InfiniBand는 일반적으로 기본적으로 더 낮은 대기 시간을 제공합니다. 이더넷 비용은 약 30~50% 저렴하며 더 넓은 데이터 센터 에코시스템과 상호 운용됩니다. 정답은 소프트웨어 스택에 따라 다릅니다. - NCCL(NVIDIA)과 OpenMPI는 두 패브릭을 모두 지원합니다.

상업 및 계획 관련 질문

Q: AI 데이터 센터의 광섬유 케이블 비용은 얼마입니까?

답변: 광케이블 및 커넥터 하드웨어는 일반적으로 총 AI 클러스터 구축 비용의 5% 미만을 차지합니다. - 주요 비용 동인은 트랜시버이며, 이는 현재 800G OSFP 가격에서 광케이블 비용의 10~20배에 이를 수 있습니다. 전체 구조화된 케이블링(사전 종단된 MTP 트렁크, 패치 패널, 카세트)을 갖춘 1,000개-GPU 포드에 대한 대략적인 계획 추정치는 트랜시버, 스위치 및 서버를 제외한 물리 계층의 경우 $150,000~$350,000입니다. 800G의 트랜시버 비용만으로도 광학 유형 및 공급업체에 따라 동일한 포드에 100만~400만 달러를 추가할 수 있습니다.

Q: 섬유 공장은 얼마나 오래 지속되며, 언제 교체해야 합니까?

답변: 적절하게 설치 및 유지 관리되는 유리 섬유는 최소한의 신호 저하로 15~25년 동안 지속됩니다. - 참조 데이터는 코닝의 섬유 수명 테스트 문서를 참조하세요. AI 데이터 센터의 수명주기 압력은 광섬유가 아닌 트랜시버와 스위치에서 비롯됩니다. 이것이 오늘날 OM5 또는 OS2에 투자하는 데 있어 핵심적인 경제적 주장입니다. 광섬유는 2세대 또는 3세대 GPU 하드웨어보다 오래 지속되며 업그레이드 비용은 케이블을 잡아당기는 것이 아닌 - 광학 및 실리콘에 의해 좌우됩니다.

Q: 400G에서 800G로 마이그레이션하는 데 시간이 얼마나 걸리고 비용은 얼마입니까?

A: 1,000~4,000개의 GPU 클러스터에 대한 구조적 마이그레이션은 일반적으로 감사부터 프로덕션 컷오버까지 4~6개월이 소요되며, 연구실 상호 운용 및 계획에는 2개월이 소요됩니다. 가장 큰 비용은 트랜시버 교체입니다. 브레이크아웃 케이블 전략은 중간-마이그레이션 스위치 CAPEX를 약 40%까지 줄일 수 있습니다. 케이블 공장 감사를 위해 20%의 예비 트렁크 재고를 할당합니다. - 설치 시 발견된 공백에는 4~8주의 리드 타임 패널티가 있습니다.

참고자료

[1] 분산 훈련 시간의 비율로 나타낸 네트워크 대기 시간: 이 추정치는 AI 인프라 논의에서 널리 순환되며 대규모 모델 훈련 효율성에 대해 Google Brain, Meta AI 및 NVIDIA에서 발표한 벤치마크와 방향적으로 일치합니다.{1}} 최근 기술적인 처리에 대해서는 Rajbhandari et al., "ZeRO: Memory Optimizations Toward Training Trillion Parameter Models," SC '20; NVIDIA의 NCCL 성능 문서. 특정 값은 클러스터 크기, 토폴로지 및 집합적 작업 유형에 따라 크게 다릅니다.

[2] 800G OSFP 다중 모드(VCSEL-기반 SR8)와 단일{4}}모드(DFB-레이저-기반 DR8/FR8) 송수신기 간의 전력 소비 비교. 공개된 대표적인 사양: Coherent 800G OSFP-DD SR8 데이터시트(일반 전력: ~14W); Coherent 800G OSFP-DD DR8 데이터시트(일반 전력: ~15~16W) 값은 제조업체 및 작동 조건에 따라 다릅니다. 재무 모델에 사용하기 전에 BOM의 특정 트랜시버 SKU를 확인하세요.

[3] 섬유 밀도 추정: (a) Corning Incorporated,AI 데이터 센터를 위한 케이블링 인프라(코닝 백서, 2024) -는 기존 기업 데이터 센터에 비해 섬유 밀도가 10배 증가했다고 언급합니다. (b) Wesco International, AI 데이터 센터 인프라 시장 분석(2024) -에서는 4~5배 밀도 추정치를 인용합니다. Corning EDGE™ 시스템 기술 문서에서 참조한 설치 시간 단축 수치(40-70%). 코닝에 문의하세요(www.corning.com/optical-커뮤니케이션) 또는 웨스코(www.wesco.com) 현재 출판물에 직접 액세스할 수 있습니다.

글로리 옵틱스(Glory Optics) 소개

닝보 글로리 광통신 유한회사2009년에 설립된 광섬유 인프라 제조업체로, 데이터 센터 케이블 구성 요소, 광섬유 커넥터, 패치 코드, 스플리터 및 인클로저를 40개국 이상 고객에게 공급하고 있습니다. 우리의데이터 센터 케이블링 제품군400G 및 800G 배포용으로 설계된 MTP/MPO 어셈블리, 광섬유 패치 패널, 구조화된 케이블링 구성 요소가 포함되어 있습니다.

제품문의나 기술상담은sales@gloryoptic.com | 견적 요청