テガラ株式会社 ホーム > 新着情報 > 研究PC関連更新情報

新着情報

研究PC関連更新情報

2019.08.16

【新着事例】流体・電磁界解析用サーバー例 (4CPU・予算400万)new


テグシスWEBサイトに、
「流体・電磁界解析用サーバー例 (予算400万)」の事例をアップしました。

pc-6226A_image.jpg


お客さまより、JMAG (電磁界解析ソフト)、STAR-CCM+ (流体解析ソフト)、
Intel Fortran Compiler などを用いた、
解析用ラックマウントPC導入のお問合せをいただきました。

ご予算 400万円以内で可能な限りコア数を増やしたいとご要望いただきましたので、
12コア×4基 (合計48コア)の 4CPU 構成でご提案いたしました。
また Windows Server 2016にて 5人同時ログインするための CAL、RDSライセンス、
およびIntelコンパイラも含めてお見積りしております。

なおストレージはサーバー用途とのことで、
RAIDカード+SSD RAID5構成としています。



【主な仕様】

CPU Xeon Gold 6126 (2.60GHz 12コア) x4 (合計48コア)
メモリ 384GB (ECC REG 16GBx24)
ストレージ 960GB SSD Intel DC S-ATAx8 (RAID5)
※ハードウェアRAIDカード
ネットワーク GigabitLANx4
筐体+電源 2Uラックマウント筐体 (幅 437 x 高さ89 x 奥行 780 mm)
+ 1600W リダンダンド電源
OS Microsoft Windows Server 2016 STD 16Core + 追加ライセンス:32 Core
その他 ・Parallel Studio XE 2019 Composer Edition for Fortran & C++
- Windows 商用特定ユーザーライセンス
・Windows Rmt Dsktp Services User CAL Open Business x5
・Windows Server User CAL 2019 Open Business x5

※Intelコンパイラは今回は特定ユーザーライセンスを選定しておりますが、
フローティング利用が必要な場合は別途ご相談ください。


■ このPC事例に関する詳細、お問い合わせはこちら
流体・電磁界解析用サーバー例 (4CPU・予算400万)

研究PC関連更新情報

2019.08.13

「Geforce RTX 2080 グラフィックボード」数量限定 特価販売しております


ただいま、NVIDIA Geforce RTX 2080 搭載グラフィックボードを、
数量限定、特価販売しております。

■現在使用しているPCの搭載グラフィックボードの性能に不満があり少し性能を上げたい
■PCにGPUを複数枚搭載したい
■保守用として確保しておきたい

このようなご要望をお持ちのお客さまにおすすめいたします。


テガラで購入したPCへのRTX 2080 グラフィックボードの搭載をご検討のお客様は、
PCのシリアルNo.(42で始まる9桁の番号)をお知らせいただけましたら、
該当PCへの搭載可否(相性など)をお調べいたします。


【製品詳細】

geforce_rtx2080_img.jpg

NVIDIA Geforce RTX 2080
GIGABYTE : GV-N2080TURBO-8GC

特価 : 92,800円 (税別・送料込)
※在庫入れ替えによる特価販売のため、弊社在庫分限りでのご提供となります。

■ 主な仕様
コアクロック : 1710 MHz
CUDAコア数 : 2,944基
メモリ : 8GB GDDR6 256-bit
SLIサポート : 2-way NVIDIA NVLINK

GIGABYTE製 TURBO FANクーリングシステム搭載モデル

スペースの限られた筐体で複数のグラフィックカードを使用するシステム用にデザインされています。
特製エアフローによる高い放熱性能が特徴です。


■ご購入のお問合せはWEBフォームよりお気軽にどうぞ


研究PC関連更新情報

2019.07.11

【新着事例】Metashape クラスタノードPC例


テグシスWEBサイトに、先日記事を公開した
「Metashape」のクラスタ構成での処理速度測定と傾向検証 に用いた
クラスタノードPC例を掲載しました。


pc-6968.jpg


こちらは単独クロックの高いCPU (Core i9 9900K 3.60GHz) に加え、
ハイエンドGPU (NVIDIA Geforce RTX 2080 Ti) を搭載しているため、
単体ワークステーションとしても活用可能な構成です。

Metashapeでのクラスタシステム構成は
管理サーバーとストレージを兼ねることもできますし、
運用の方法によってはストレージは別としたほうが場合もございます。
お客様の運用の方法にあわせたおすすめの構成をご案内いたしますので、
まずはご相談ください。


なお、Metashapeをクラスタ運用する場合には、
各ノード毎にライセンスが必要となります。
Metasgapeライセンスのご購入もテガラ株式会社 ユニポス事業部で承りますので、
あわせて是非ご相談ください。


【主な仕様】

CPU Core i9 9900K (3.60GHz 8コア)
メモリ 64GB (16GBx4)
ストレージ SSD 1TB(S-ATA)
ビデオ NVIDIA Geforce RTX 2080 Ti
ネットワーク GigabitLAN x1
筐体+電源 ミドルタワー筐体 (幅233 x 高さ465 x 奥行 543 mm) +750W
OS Windows 10 Professional 64bit

本事例の掲載時点(2019年7月)では、メモリの最大搭載量は64GBですが、
将来的に 最大128GBまで搭載可能になるRevが提供される予定です。


■ このPC事例に関する詳細、お問い合わせはこちら
Metashape クラスタノードPC例

研究PC関連更新情報

2019.07.01

【新着事例】2CPU、4GPU構成の映像合成AI学習用WS例 (予算400万)


テグシスWEBサイトに、
「2CPU、4GPU構成の映像合成AI学習用WS例 (予算400万)」の事例をアップしました。


pc-6766.jpg

お客様より、映像合成のためのニューラルネットワーク学習を行うことを目的とした
ワークステーションの購入検討のご相談をいただきました。

GPUはお客様のご要望に応じ、TITAN V での構成でご提案しました。
また各種必要なフレームワークのインストールのご要望もいただきましたので、
弊社にてご指定のフレームワークのインストール及び、
GPU対応のOpenCVをCUDAサポート付きでビルド設定して出荷いたしました。


なお本構成は2CPU+4GPU搭載のため
、消費電力が大きく、
200V環境でのご利用を前提としております。ご注意くださいませ。


【主な仕様】

CPU Xeon Gold 5120 (2.20GHz 14コア) x 2 (合計28コア)
メモリ 192GB ECC REG
ストレージ システム:SSD 4TB (S-ATA) + データ:HDD 4TB (S-ATA)
ネットワーク 10GBase-T x 2
ビデオ NVIDIA TITAN V 12GB x 4 + NVIDIA Quadro P400 (画面出力用)
筐体+電源 4Uタワー筐体 (幅178x高さ462x奥行673mm)
+ 2200W リダンダント電源 ※100Vでのご利用時は1200Wまで
OS Ubuntu 18.04
その他 250V/12A用 オプション電源ケーブル x 2、GPUキット、
NVIDIA CUDA Toolkit、 フレームワークインストール
「あんしん+」 3年保証


なお今回のご提案ではお客様のご希望により
3年延長保証 (あんしん+)を適用しております。


弊社ではGeForce系のシステムに関しても
保証を3年まで延長可能ですのでご検討ください。


geforce_system_anshin_plus.jpg


■ このPC事例に関する詳細、お問い合わせはこちら
2CPU、4GPU構成の映像合成AI学習用WS例 (予算400万)


研究PC関連更新情報

2019.06.28

【記事】「Metashape」のクラスタ構成での処理速度測定と傾向検証 (後編)

metashape_report_title.jpg

先日公開を致しました前編の記事では、同じ仕様のマシン4台のクラスタ構成での「Metashape」の処理速度測定の実施とその傾向を検証しました。
その結果を元に、こちらの後編では「CPUのコア数優先」処理の傾向を検証します。

※本ページの記事は「後編」となります。前編記事はこちら



検証環境について

計測は、前回同様の下記クラスタノードをベースとした構成に、CPUのコア数を増やした仕様を1台、CPUノードとして追加し、実施しました。

クラスタノード
CPU Intel Core i9 9900K (3.60GHz/TB5.0GHz, 8C/16T)
メモリ 40GB
SSD 1TB S-ATA
GPU Geforce RTX 2080Ti × 1
LAN Onboard(1GbE)
OS Microsoft Windows 10 Professional 64bit
Metashape Ver 1.5.2.7838

追加したCPUノードは以下のスペックとなります。
CPUのコア数は2CPU構成で16コアとなり、2CPUのXeon仕様としては最上位クラスの定格クロックとTBクロックの構成となります。

CPUノード
CPU Xeon Gold 6144 (3.50GHz/TB4.20GHz, 8C/16T) × 2 (合計16コア)
メモリ 768GB
OS Microsoft Windows 10 Professional 64bit


処理内容について

今回行った処理はオルソ画像処理の一連のバッチ処理となります。
この処理においては、前編で使用したDollのサンプルデータですと少し負荷が低めのため計測結果の差が判別しづらかったため、以下のようなデータを弊社で用意し、使用しました。

metashape_report2_drone.jpg

処理内容は前回同様、①MatchPhotos ②AlignCameras ③BuildDepthMaps ④BuildDenseCloud ⑤BuildModel ⑥BuildUV ⑦BuildTexture を実施します。

計測方法としては、上記CPUノード構成のマシンをCPUのみを使用する設定でノードとして使用し、ノード処理の優先順位をHighestに設定しております。これで⑤BuildModel~⑦BuildTexture でのCPU処理はこちらのノードで計算されることになります。ただし、他の処理においてもCPUでも計算する場合にはこのノードに処理が割り振られておりますので、個別の部分では多少の差異がある点はご注意ください。

Metshape側の処理は以下のパラメーターでの実施となります。
Aligen Photos : Highest
Build Dense Cloud : Ultra High
Build Mesh : High field&High
Build Texture : Orthophoto

(今回はBuild Meshの処理がHighクオリティとなります。理由に関しましては後述します)


処理結果について

まずは①MatchPhotos~⑦BuildTexture までの一通りのトータル処理時間を計算した結果です。

クラスタ 1台 (RTX 2080Ti × 1) 4時間33分01秒
クラスタ 2台 (RTX 2080Ti × 2) 3時間45分45秒
クラスタ 3台 (RTX 2080Ti × 3) 3時間33分33秒
クラスタ 4台 (RTX 2080Ti × 4) 3時間31分35秒
クラスタ 4台 (RTX 2080Ti × 4) + CPU Node
3時間17分09秒
比較用単体システム (RTX 2080Ti × 2) 4時間16分33秒

※比較用単体システムのスペックについては前編をご参照ください


次に前編と同様に各フェーズについて検証します。
metashape_report2_img1.jpg
(Y軸=経過時間 : グラフが長いほど処理に時間がかかっている)

#単独システムの場合はログの出方が異なるため、上記のグラフには載せていません。


予想通り、⑤BuildModel~⑦BuildTextureの部分でCPUノードを追加した場合に大きな変化が見られました。同一ノードのみで実施の場合は前回同様に処理時間は横並びですが、CPUノードに処理をさせた事で差が発生しました。⑤BuildModelと⑦BuildTextureに関しては処理時間が短くなり、逆に⑥BuildUVに関しては長くなっています。

ここで改めて今回のクラスタノードとCPUノードのCPUを比較します。

クラスタノード
CPU Intel Core i9 9900K(3.60GHz/TB5.0GHz 8C/16T) ×1

CPUノード
CPU Xeon Gold 6144 (3.50GHz/TB4.20GHz 8C/16T) × 2 (合計16コア)


クラスタノード側の方が単独コアの動作速度は速く、CPUノード側の方がコア数が多いといった関係になります。ここから、⑤BuildModel 及び ⑦BuildTexture時間はコア数が有効に働く処理であり、⑥ BuildUVは単独コアの動作速度が重要であるということが推測されます。

また、④BuildDenseCloudの処理時間については、4ノード(クラスタ4台)の結果よりも時間がかかっています。これはGPU処理よりも処理速度が遅いCPUにCPUノードが増えた分だけ処理が分散されてしまい、GPU搭載のクラスタノードは処理が終わっていても、CPU側の処理が終わらず、その処理が終了するのを待ってしまっていた結果と推測されます。実際にはこの処理はログ上では複数の処理に分割され (今回の検証においては106~108 程度)、処理が終わったら次の処理...と渡されていくため、分割された最後の処理が終わるタイミングによっては逆に処理時間は速くなる可能性も考えられます。
なお今回のクラスタノードは同一のCPU/GPU構成ですが、異なるCPUやGPUでの構築をされた場合、速度の遅いCPUやGPUなどがこの処理でボトルネックになる可能性があるということが考えられます。

最後に、「処理内容について」の項目で挙げました、Build Meshの処理をUltra Highで実施しなかった理由については『実施できなかったため』となります。1クラスタあたり40GBのメモリでは今回のデータを処理するのには足りず、処理が進みませんでした。

潤沢にメモリをもっているCPUノード構成 (768GB)の場合はUltra Highでも処理が可能でしたので、Build Meshに関してはノード1台に処理が集中してしまう関係上、その1台に十分なメモリが必要であると推測されます。


まとめ

以上、クラスタを利用したMetashapeの処理速度の検証結果となります。

前編・後編を通してのここまでのデータを元に検討しますと、④BuildDenseCloud処理まではクラスタ構成が有利ですが、それ以降の処理についてはあまり効果的ではないと言えそうです。

また、上記でも触れております通り、Build Meshなどの処理は結局の所、 1台のCPUで処理をする必要があり、その1台に十分なメモリ容量も必要となってきます。クラスタ構成を検討する場合でも、全体の処理として考えた場合に、メモリが足りない事により必要としている処理ができないという可能性がございますので、少なくとも1台は十分なメモリを積んだPCを用意していただくのがよろしいかと思います。

単独クロックの速いCPUを選択しても、搭載できるメモリ容量には上限がありますので、メモリ搭載量の面で見れば、Xeonシステムのほうが有利となります。そのため、単純に単独クロックが速いCPUがお勧めとも言い切れないところがあります。
※今回検証に使用したCPU (Core i9 9900K)は64GBまでのメモリに対応となります (2019年4月時点。将来のRevでは128GBに対応が予定されています)。

 

現状でMetashapeクラスタ構成を検討する場合、通常は個別で利用しているMetashapeを、大規模な処理が必要な場合に一時的にクラスタとして利用する使い方や、④BuildDenseCloud処理までの作業を行わせるサーバーファームとしての運用等が考えられます。

なお、今回の検証では速度計測をメインにおいておりましたので、すべて1ジョブのみで実施をしておりましたが、当然複数のジョブを実行することも可能です。この場合、処理がBuild Meshに入った時点で、計算している1台のマシン以外がフリーになった場合には次のジョブが走り始めますので、複数のジョブを投げて短時間で処理をさせるという用途でもクラスタ構成は有効であると思われます。


■ 2019年7月11日追記  : こちらの検証に利用したクラスタノードPCを事例として公開しました

ページの先頭へ