次世代グリーンデータセンター NPO コールド プレート液冷スイッチを発表

時間:2022-09-26

インターネット技術の発展によ、データセンターは徐々に「コンピューティングセンター」に遷移しています。 人工知能や機械学習などの演算能力の応用が急速に展開されることに伴い、「自動運転」、「ビッグデータにおけるストリーミング」、「興味EC」などの様々なサービスが次々と生まれています。 人工知能や機械学習など分野における使用される GPU (Graphics Processing Unit) コンピューティングクラスターは、一般的な CPU (中央処理装置、中央処理装置) よりさらに高速なネットワークを求めています。いわゆる「サービス主導のネットワーク進化」の発展モデルで進んでいます。このよう発展モデル中では高性能GPU技術が先に進んで業務におけるハイクラスの要件を満たし,その次に、一般的利用シーンに適用し技術価値を最大限に活かせようるような形で進んでいます。

?1.png

図1:データセンターのネットワークアーキテクチャのイメージ


ビジネスニーズ以外、機能要件を満すようにデータセンターの周辺設備のアップグレードもネットワークを進化させていきます。たとえば、次世代の H100 を搭載したGPU サーバーは、400Gの帯域幅を、CX7スマートNICはPAM4-112G SerDes (シリアル/デシリアライザー)に対応可能なネットワークスイッチを求めています。

日々高まったビジネスニーズとハードウェアの革新によりデータセンターのネットワークアーキテクチャがアップグレードしなければならない傾向になっています。それに合わせてスイッチチップ、SerDes、および光トランシーバの技術も共に進化させる必要があります。これらの技術が進んでいる中で抱かえていた多くの課題の中に最も難しいのは低消費電力の実現の課題です。

 

 

?2.png

       図2:データセンターネットワーク発展を推進する要素と消費電力低減の課題


まずスイッチ性能に大きく関わるスイッチチップから見てみると、スイッチチップのアップグレードによって、1ビット(bit)ごとの消費電力は削減される一方、スイッチングの帯域幅が広がるによって増加したチップの消費電力がデータセンターに占める割合が年々増加傾向にあります。 また、スイッチチップだけでなく、SerDesや光トランシーバも消費電力の増加も大きな要素であります。 統計によると、2022年のスイッチの消費電力は2010年の22倍増加になり、その中でSerDesの消費電力は25倍増加、光トランシーバの消費電力は26倍増加になります。

?3.png

      図3:2020 Ciso and /or its affiliates.All rights reserved.Ciso public


次光トランシーバの進化について、2007年の10ギガビットの光トランシーバの消費電力はまだ1W以下でしたが、それから40G、100G、400G、800G、さらに1.6Tの光トランシーバの実現によって消費電力が30Wまで増加する見込みで、1.6Tの光トランシーバをフル搭載したスイッチだと想像以上の消費電力になります。それに従って、データセンターのアップグレードにより従来のプラガブル光トランシーバが将来に対応するのが難しくなります、その原因は以下4つがあります。

?4.png

 図4:従来のプラガブル光トランシーバの発展のボトルネック


まず、SI (電気伝送) を実現できる材料の開発がボトルネックに遭遇することです. PCB (プリント回路基板) で高速電気信号を伝送するには従来のプラガブル光トランシーバを使用すると、信号伝送距離が長くなり、損失も大きいです。さらに低伝送損失のPCB 材料を量生産することも、多くの技術的困難に直面しています。 その次は消費電力の問題で、1.6Tモジュールを搭載した設備は消費電力が大きくなるため、キャビネット(電力供給含む)放熱設計に大きな課題が生じます。 設備の電力消費の増加に従って、風力、火力、水力発電など周辺機器のコストも増加し、ネットワーク構築の初期段階での投資額もすごく高くなります。 最後、製品設計にも課題があります. 従来の光トランシーバを使用して 128 ポート対応可能なシステムは, 非常に複雑なシステム設計を必要とします. また, 高出力光トランシーバ放熱などの技術的問題を解決することによって,システムコストも高くなります。

Ruijie Networksはスイッチチップ、SerDes、および光トランシーバの技術によるデータセンターネットワークアーキテクチャ進化で抱かえた電力消費の問題解決に向け、次世代の環境に優しく、省エネで持続可能なデータセンターの構築を目標として顧客の業務と製品実践に合わせて持続可能なデータセンターネットワークの革新的なソリューションまた技術開発路線について次3段階の提案を行っております。

 

段階1はまずアーキテクチャのアップグレードを行うことです。次世代チップ、SerDes、および光トランシーバ技術に基づいてネットワークアーキテクチャをアップグレードすることで人工知能や機械学習などの応用による帯域幅への需要を満たすことができます。 アーキテクチャをアップグレードしてからネットワーク機器、SerDes 、光トランシーバの消費電力の問題を解決していきます。消費電力の問題は今世代に限ることではなく、今後の世代のネットワークアーキテクチャも同じ課題に直面することになるため、将来を見据えて、データセンターネットワークの低コストと低消費電力の持続可能な開発方法を模索し続ける必要があります。 

 

?5.png

  図5:次世代グリーン省エネ且つ持続可能なデータセンター構築目標


持続可能な技術開発目標はスイッチのシリコンフォトニクス技術発展の2つ段階から実現できます。 最初の段階はCPO (Co-packaged optics) のエコシステムが整えるまでに、NPO (Near packaged optics) 技術を活用することにより最短期間でコストと消費電力を抑えることができます。その次、ネットワークのコストと消費電力を極限まで下げることができるスイッチのシリコンフォトニクス技術の最終形態である CPO 技術段階です。

 

 

?6.png

   図6:データセンターネットワークの持続可能な発展路線についての提案

?7.png

図7:シリコンフォトニクス技術形態の概要


光電変換機能を備えたPluggable(プラガブル)形態の光エンジンが最も一般的な使われるものですが、技術の進化に伴い、新しい仕様の製品が現れています。 CPO形態は、スイッチチップと光学エンジンを同じソケットに組み合わせて、チップとモジュールの共同パッケージになります。 NPO形態は、光学エンジンとスイッチチップデカップリングが同じシステムのマザーボードに組み込まれています。 どちらも光電子モジュールを備えていますが、パッケージの位置が異なり、それによって配線距離も多少違いがあり、消費電力も異なります。


CPOアーキテクチャは、シリコンフォトニクスより最高密度を実現できてコストと消費電力の削減できること期待されています。 CPOは消費電力を低減する仕組みは、「共同パッケージ」フォームファクタよりスイッチチップと光学エンジンと間の配線距離を (配線は約 50~70mmまで制御可能) 大幅に短縮することでSerDes駆動電力を削減できます。さらに高密度且つ高速ポートを実現することでネットワーク機器全体の帯域密度を高め、大幅な消費電力削減も実現できます。 しかしチップとシリコンフォトニクスを共同パッケージのコンポーネントとシリコンフォトニクス技術の不完全性により、商用化の観点からだとオープン化することが長期的な目標となります。

?8.png

図8:CPOアーキテクチャイメージ

?9.png

図9:CPO原理図

 

NPOアーキテクチャはシリコンフォトニクス技術による高集積化とオープンなエコシステムにより、最速で低コストと低消費電力を実現できる利点があります。

NPO の技術原理は、オープンな光学エンジンインターフェースを介して、同じマザーボード上にスイッチチップが組み込まれ、光学エンジンとチップのデカップリングが標準化された構造で実現され、スイッチチップとNPOモジュールタイプを柔軟に選択できます。NPO は、消費電力とコスト削減の点で CPOほど顕著ではありませんが、オープ化の面から改善されています。 NPO 産業チェーンの成熟度が高まるにつれて、24年までCPOモジュールの商用化が実現できることを予想されてます。Ruijie Networks は OIF (Optical Internetworking Forum) のメンバーとして、NPO スイッチ分野で絶えずに模索と実践しております。

?10.png

図10:NPOアーキテクチャイメージ


2021年11月、Ruijie Networks はグローバル OCP サミットに招待され、サミットで、Ruijie Networks は、データセンターとキャリアネットワークの高い信頼性要件に対応する25.6T NPO コールド プレート液冷スイッチを正式に発表しました。

 

?11.png

図11:Ruijie Networks 25.6TNPO コールドプレート液冷スイッチ


Ruijie Networks 25.6T NPO コールドプレート液冷スイッチは、最新の 112G Serdes スイッチチップで64 個のコネクタを採用し、1RU スペースで400G*64ポート 超高密度ポート設計を実現します。 16個の 1.6 T (4×400G DR4) NPO モジュールで構成され、8 つの ELS/RLS (外付けレーザー入力用ELSポート) を対応、PCB 上の ASIC から光モジュールまでの配線距離を 60%~70%短縮し、大幅に高速信号品質を向上させます。 機器全体は x86CPU、3+1ファンモジュール、1+1 冗長電源モジュールを採用し、コア領域は放熱のためにコールドプレートを採用し、非導電性冷却液を使用して漏れや短絡のリスクを完全に避けることができ、データセンターネットワークの持続可能な進化をサポートしております。

 

?12.png

図12:Ruijie Networks 25.6TNPO コールドプレート液冷スイッチ


2022 年に、OFC2022 で Ruijie Networks によってリリースされた最新の 51.2T NPO コールド プレート液冷スイッチは、51.2Tスイッチングチップを採用する 800G NPO 構造のプロトタイプです。 また、高さ 1RU の 51.2T スイッチングのNPO モジュールを 1.6T から 3.2T にアップグレードされます. フロントパネルは800G*64 コネクタに対応し、各コネクタは上位互換性のために 2 つの 400G ポートに分けることができます. 外付けレーザー入力モジュールが 16個 までに増加しました。Blind-mate設計により、高出力レーザーによる人の目の損傷が回避され、操作および保守担当者の安全性を大幅に向上させます。 放熱に関しては、スイッチングチップとNPOモジュールはコールドプレート冷却方式も対応しており、効率的な放熱を実現し、熱流密度が非常に集中する問題を解決することができました。同じ性能のスイッチングと比較すると、従来のプラガブル光モジュール +空冷ソリューションのスイッチングにより、消費電力が大幅に削減されます。

 

 

?13.png

図12:Ruijie Networks 51.2T NPO コールドプレート液冷スイッチ


また2022年にOFC2022で Ruijie Networks によってリリースされた最新の 51.2T NPO コールド プレート液冷スイッチは次世代の超大規模400Gネットワークに適用できます。リーフ&スパイン型ネットワーク設備として、2023 年末までに商用化を実現できます。低消費電力と低コストでお客様の利益を最大化することを可能な限り短時間で実現できるように支援しております。

?14.png

Ruijie Networks は現在、グローバルに展開しており、OIF/COBO のメンバーとして、シリコンフォトニクス関連のワーキンググループのグローバルミーティングに定期的に参加し、世界の技術進歩に貢献するよう努めております。 将来的には、Ruijie Networks は、シリコンフォトニクス技術分野で持続可能な開発を続け、お客様のグリーンエネルギー効率化に貢献する製品をより多く開発できるように取り組んでおります。