「 DirectX 」一覧

DirectX12 で画面クリアまで (祝)


DirectX12 (D3D12) を使ってようやく画面のクリアだけエラーも起こらず動作させることができるようになりました。そもそも SDK が正式版ではないので、今後変更されることもあると思います。それでも気になる人のために、コードをさらしてみたいと思います。Windows8.x以降、 Win32 アプリケーションは肩身が狭くなってきた感がありますが、ここでのサンプルは相変わらず Win32アプリケーションで作成してみました。
以下の内容は既に古くなっています。以下のコードでも動きますが、よりコード量の少なくなったこちらの記事を参考にどうぞ
本内容は既に最新環境では正常にコンパイルできません。ご注意ください 2015/5

必要なもの

VisualStudio 2013 でも作業できそうに思いますが、すべて最新の状況で作業しました。作業している最中に Windows10 は 10049 に上がっちゃいましたが。以下のものをインストールしました。

  • VisualStudio 2015 CTP6
  • VisualStudio Tools for Windows10 Technical Preview
  • Windows10 Technical Preview 10041

d3d12_clear

とりあえず上記のように画面のクリア処理がうまく動くようになりました。結構手間取ったので喜びもひとしおです! 続きを読む


DirectX12を触ってみた(不完全)


DirectX12 (D3D12) を使って画面のクリアまでは簡単にやれるかなと思っていたのですが、そこまでたどり着けませんでした。先日のドキュメント参照しながらやっているだけでは不十分で、ちょっと試行錯誤&ヘッダの探索なども必要でした。

自分の現状ではこんなところですが、これからトライされる方々にちょっとでも参考になればと思って、いくらかメモを残しておこうと思います。以下の項目は自分がとても時間がかかってしまったポイントばかりです。

なお、正式な情報が見当たらないため、ここにある情報も正しいどころか間違っている可能性もとても高いのでその辺はご了承くださいませ。なお以下の話はすべて Win32Application で C++ のみでやってます。

GetDefaultCommandQueue は無い

ドキュメントでは ID3D12Device から GetDefaultCommandQueue なる API があるように書かれていますが、実際のところは存在しません。
これについては、 D3D12_COMMAND_QUEUE_DESC に値をセットして自分で明示的に ID3D12CommandQueue を作成して対処しました。

SwapChainの作成

ドキュメントの方では ID3D12Device から QueryInterface で IDXGIDevice2 インターフェイスを取得するようになっています。しかしながら手元の環境ではこのインターフェースを取得することが出来ませんでした。 WARP デバイスが悪いのかと思い、 GCN 世代のボードと換装してトライしましたが同様の結果でした。
結局のところは CreateDXGIFactory2 関数から IDXGIFactory2 をもらうことでスワップチェインの作成を行っています。

ID3D12CommandListについて

ID3D12CommandList ではなく、 ID3D12GraphicsCommandList を生成する必要があるようです。そうしないと、グラフィックス用のいろいろなメソッドが使用できませんでした。たとえば、 SetDescriptorHeaps, ClearRenderTargetView など。
また、直接はコマンドキューに積めないので、 CommandListCast というキャスト用関数を介してキューに積むようにしています。これもヘッダの中を探索していて発見した関数です。もしかしたらMSDN ドキュメントに記載があったかもしれませんが・・・。

以降は、さらに不確定さ怪しさが高いので、概要だけにしておきます。 続きを読む


ついにDirectX12 を触れるようになったようです!


Windows 10 Technical Preview と VisualStudio 2015 Preview CTP6 により、とうとう一般の開発者でも DirectX12 (D3D12) のプログラムを作れる&試せるようになってきました。また MSDN のドキュメントとしても次の場所に公開されたので、 dll だけあるけど使い方がわからないというような状況から抜け出せたようです。

このような状況になったので、手元の物理 PC に早速 Windows10 Technical Preview (Win10TP) をインストールし、VS2015CTP6 も導入を開始しました。 CTP6 をフルインストールしたら結構時間がかかってしまったので、簡単に確認できたところだけ紹介したいと思います。 続きを読む


Direct3D9Exでフルスクリーン


DirectX9 でのフルスクリーンのサンプルはそこそこ見かけるのですが、DirectX9Ex でのフルスクリーンのサンプルってほとんど見かけないので作ってみました。通常の DirectX9 とほとんど同じで、違う箇所は初期化のところだけだったのでその部分だけを本記事では紹介したいと思います。

DirectX9Exの初期化

Direct3DCreate9 の代わりに Direct3DCreate9Ex を使用します。引数がちょっと変わっています。
そして定番の D3DPRESENT_PARAMETERS を設定します。本来はもうちょっとモニタの設定とか確認したりエラーチェック入れたりする必要があるのですが、サンプルなので省略してます。

ここでのポイントは特にないと思います。続いて CreateDeviceEx を呼び出してデバイスを作成するのですが、こちらの方には気をつけるポイントが存在します。まずはコードを示します。

ポイントとは、Windowモードの時には D3DDISPLAYMODEEX を設定してはならない点、フルスクリーンのときには設定が必須となる点が1つです。もう1つは D3DPRESENT_PARAMETERS のリフレッシュレート設定と DISPLAYMODEEX のリフレッシュ設定を同じにしなくてはならない点です。適当にゼロを入れておくのでは関数が失敗となります。

この関数が成功したらあとは通常の DirectX9 と変わらないです。

今回は不遇の扱いをされているDirectX9Ex のしかもほとんど情報がなさそうなフルスクリーンをやってみました。通常の DirectX9 と違い DirectX9Ex ではデバイスロストの問題も発生しないですし、割と使いやすいものだと思います。 Vista 以降を必須とする点はちょっとマイナスかもしれませんが、毛嫌いするほど出来が悪いとも思えないんですよね~


BC7の圧縮ノイズについて調べてみた


優秀だという BC7 圧縮の品質がどんなものか調べてみました。
そのためにはそこそこの品質以上の画像データが必要だったので友人に協力してもらい画像を使わせてもらっています。
この場を借りてお礼申し上げます。

BC7への圧縮については Codeplex からダウンロードできる Microsoft の TexConv を使用しています。この最高品質となる CPU で処理した結果ではなく、 GPU を用いた速度とのバランスがとれているであろうモードを選択しています。

比較

いきなりですが圧縮前後の画像を比較してみます。
左が圧縮前、右が圧縮後のデータです。圧縮ノイズなどは確認できるでしょうか?自分では等倍でぱっと見た感じわかりませんでした。心持ち髪の毛曲線部とアルファの部分でノイズが気になるかも程度です。
compare_std_bc7_sample01
compare_std_bc7_sample02

続きを読む


DirectX9 on Windows 7 でメモリの消費調査


今回は DirectX 9.0 を用いた場合ではどんな感じになるのかを調べてみました。環境は Windows 7 (x64) です。また DirectX 9.0 と表記していますが、実際のところは DirectX 9.0 EX のことを指すものとします。

Windows XP までの頃は VRAM の仮想化というものがなく、デバイスロスト発生のためのケアが必要になっていました。その代わり VRAM にデータを送ってしまい、メインメモリは消費しないということができたように思います。(もしかするとできていなかったのかもしれませんが、今更検証価値も低そうなので手元でテストしていないです・・・。)
一方で Windows 7 になってVRAM仮想化が導入され、VRAMの空き容量など取得が難しくなってきました。 DirectX 9.0 は動くものの、その挙動は XP のころとはまた違ったものになっていると予想されます。それなのに検証をしていないままだったので、 VRAMの情報取得という武器ができた今、調べてみようと思ったわけです。

NVIDIA (Geforce9800) の場合

安定状態になってから頂点バッファ 32MB を D3DPOOL_DEFAULT にて作成しました.

状態 メモリ(MB) Dedicate(MB) 共有メモリ(MB)
定常状態 1054.6 47 13
VertexBuffer作成 1回目 1086.7 80 13
VertexBuffer作成 2回目 1119.3 112 13

どの場合においてもメインメモリ 32MB 程度消費し、Dedicate のメモリ 32MB ほど消費している結果となりました。

AMD (RADEON) の場合

状態 メモリ(MB) Dedicate(MB) 共有メモリ(MB)
定常状態 1028.9 45 22
VertexBuffer作成 1回目 1061.1 77 22
VertexBuffer作成 2回目 1093.8 109 22

こちらの場合においてもメインメモリ 32MB 程度消費し、Dedicate のメモリ 32MB ほど消費している結果となりました。

実験その2

描画フレームを回しながら、 100 フレームごとに頂点バッファを確保し描画するという定番のプログラムで実験してみました。
上記の消費メモリが永続的なものではなくテンポラリ扱いならば、相当の数のバッファが作れるはずです。

しかし予想外の結果になりました。

メインメモリの消費が、自分のプロセスに対して発生していました。どうやら D3DPOOL_DEFAULT では自プロセスのどこかにバックアップのバッファが存在するようです。

GTX 750Ti 2GB の状態で普通の 32bit アプリケーションで実行の場合には、x64環境といえども、 1プロセスで使えるサイズは 2GB まで。そのため VRAM 使用量が 1GB 程度のところで DirectX がバッファの作成に失敗しました、とエラーを出しました。このときのプロセスの状況を調べてみましたが、消費されている仮想アドレスが 2GB 近かったです。
 一方で、 32bit アプリで LAA オプションをつけて再実行してみると、今度は VRAM 使用量は 1.7GB 程度にまでなり、プロセスの仮想アドレス使用量は 4GB 近くにまでなっていました。

※ このプロセス内での状況を知るのに VMMap というツールは便利です。

まとめ

DirectX 9.0 の場合においては NVIDIA も AMD も同じような挙動となることを確認できました。またどちらの場合においても使用するリソース分、メインメモリも消費していることが確認できました。これはこれで挙動把握さえできてしまえば、扱いやすそうです。
ただ注意が必要であると感じたのが、自分のプロセスの仮想アドレス空間にバックアップ先を確保するため、メモリ不足よりも自身の仮想アドレス空間を枯渇させてしまうのが早そうに思います。 64bit 環境を必須とするなら 32bit アプリケーションの場合、 LAA 必須といってもいいレベルだと思いました。
 この場合、よいビデオボードを使っていて 「 4GB の VRAM 全部使いきる DirectX 9.0 アプリケーションを開発してやるぞ。 ただし 32bit アプリケーションだけどなっ」 という夢はかなわないことが判明しました。そんな人は少数派だとは思いますが・・・。


DirectX11の場合のシステムメモリとVRAM消費について


今までは OpenGL の場合を調査してきました。今回は DirectX11の場合を調べてみようと思います。ドライバが一緒ならきっと同じ傾向を示すんじゃないかなと予想して実験をスタートです。

実験

DirectX11のプログラムとして、100フレームごとに頂点バッファ 32MB を確保し、次フレーム以降はこのデータを使って描画するプログラムを作成しました。
各フレームでの各メモリの使用状況を取得して、グラフ化しました。

実験は以下の環境で行いました

  • GTX750Ti Windows 7 347.09
  • RADEON HD 5450 Windows 7
  • RADEON HD 5450 Windows 8

結果

それぞれの実験結果のグラフを以下に示します。

nvidia_memory_graph_dx11_win7

radeon_memoy_graph_dx11_win7

radeon_memoy_graph_dx11_win8

NVIDIA も AMD も同じような挙動を示す結果となりました。また VRAM が使用可能な状態であれば、追加のシステムメモリの消費もなく良好といえそうです。(とはいっても追加のメモリを要求されたのは NVIDIA OpenGL の場合のみでしたが)。さすが仕様が決まっている DirectX といえるかなと思います。
 ちなみに RADEON のほうのグラフ末尾がおかしなことになっていますが、このときアプリは相変わらずフリーズ状態になってしまいました。ですので、システムメモリを VRAM リソースとして使用始めたらやや注意が必要になっていきそうです。ビデオメモリ仮想化が入ったといわれる現時点においても、なるべく搭載量を超えないようにするのはマナーとしておいたほうがよさそうです。


GPUViewを使う前に


GPUViewを使ってみようと思い、Windows Performance Toolkit とかを入れてみたのですが、ログ収集のためのコマンドバッチ log.cmd を実行するとエラーが出ることが確認できました。ちなみにこの症状は WIndows7 64bit 上で確認しています。
 そのエラーというのが、「4000 の使い方が誤っています。」というもので、このメッセージだけではよくわかりません。

これを解決するためには環境変数をセットすると良いようです。log.cmdを実行する前に、以下のようにして値をセットすると実行できるようになりました。

実行した後は、対象アプリケーションなどを実行して、再び log.cmd を実行してログ収集を停止して、その際に出来上がる Merged.etl ファイルを GPUView で開いてあげれば OK です。まだ GPUView の見方がわかっていませんが、これで実行&情報収集は出来るようになったのでよしとします。


XInputの注意事項


最近になってゲームパッドのコーナーを見てみると、純正XBOX 360パッド以外でもたくさんの XINPUTの対応パッドが並んでいることに気付きました。これはXINPUT無視できないなーと感じました。また多くのパッドが DirectInput との切り替えスイッチを持っていて、両対応できるようになっていました。
 これはアプリケーション側も両対応しておいたほうが何かと都合良さそうな感じです。

ひとつ注意事項があります。
VisualStudio 2012など使っていると DirectXSDKが統合されたこともあり、XInputのインクルードやライブラリのリンクについてちょちょいとやってしまえるのですが、ここに罠があります。
 VisualStudio 2012 では標準の対象 OS が Windows8 であることを想定しているため、XInput も Windows8のものをリンクするようになっています(XInput.lib指定時)。これを回避して、Windows7やWindows8で動くようにするためには、リンクするライブラリを “Xinput9_1_0.lib” に変更します。これで Windows7の環境でも動作させることが出来るようになります。ただ古いバージョンになるため使用できるAPIに制限が出来てしまいますので、注意が必要です。

参考: XInput Versions(MSDN)


DirectX11で複数ウィンドウを使ってみる


最近Mach-Oの調査ばっかりやっているので、DirectX11とか触ってるとほっとします。

昨今では2つのディスプレイが繋がっていることも珍しくないと思います。
それぞれに対してDirectXアプリケーションのフルスクリーンやりたいとか、独立した複数ウィンドウでDirectXの描画やりたいとかそういうときにどうしたらよいかを実験してみました。

結論から言えば、複数のデバイスコンテキストを作る必要すら無く、レンダーターゲットビューとスワップチェインを複数持つことでこれらを実現出来ることがわかりました。デバイスが独立ではないのでリソースも共有出来ます。

初期化

DirectX11の初期化部分を説明します。
D3D11CreateDeviceAndSwapChain関数を使用して初期化することは出来ないようで、必要なオブジェクトを順番に作成していく必要があります。まずは D3D11CreateDevice関数でデバイスの初期化、続いて必要な数のスワップチェインの作成となります。
スワップチェインの作成はデバイスから直で出来ず、DXGIのオブジェクトを数回経由する必要があります。

これらの処理をざっくりと以下に示します。

スワップチェインを作成できたら、それぞれのウィンドウ(場合によってはディスプレイ)に対してのバックバッファを作成しておきます。
これはpSwapChain[0]->CreateRenderTargetViewでいつも通りに作成する感じです。必要ならデプスステンシルも作成しておきます。

描画

描画の方は何も難しいことはありません。複数のレンダーターゲットを扱ったことがある人なら意識するような違いがないです。コードを以下に示します。

まとめ

マルチウィンドウにすることでどのくらい2重でデータ持ちしないといけないかと心配しましたが、結構楽に実現出来ることがわかりました。スワップチェインが個別という程度で、他はマルチレンダーターゲットやっているときと変わらない感じです。

今回試してみたプログラムでは以下のようにリソースも1つでそれぞれに描画してみました。

dx11_multi_window