C言語 プログラミング

バイナリを逆アセンブルして中を覗いてみた

どんなプログラミング言語でも最終的には機械語に翻訳されて実行されるので、プログラムの真の動きを知るためには翻訳された機械語を見ることが一番です。

とはいえ、機械語そのものはちょっとハードルが高いので、その一歩手前のアセンブラのレベルでどうなっているのかを見てみることにしました。

検証するプログラム

今回検証するプログラムは以下です。このプログラムをgccでコンパイルしてオブジェクトファイルを生成し、その中身を逆アセンブルして覗いてみます。

コンパイルと逆アセンブル

まずはソースをコンパイルしてオブジェクトファイル(.o)を作ります。「-g」を指定してデバッグ情報を埋め込んでおくと、逆アセンブルしたときに見やすくなります。

gcc main.c -g -c

オブジェクトファイルができたら、objdumpコマンドで中身を逆アセンブルします。このとき「-S」を指定すれば、バイナリに埋め込まれたデバッグ情報を元にソースコードとの対応付きで中身を表示してくれます。

objdump main.o -S

ということで、このプログラムを逆アセンブルした結果はこんな感じになりました。これでプログラムの動きをアセンブラレベルで追うことができます。

中身を見ていこう

main関数の中身自体はたった4行ですが、アセンブラだと倍近くの行数になるようです。「elf64-x86-64」とあるように、x86アーキテクチャに基づいたアセンブラとなります。さっそく上から1つ1つ見ていきましょう。

push %rbp

rbpはベースポインタと呼ばれるレジスタで、関数に割り当てられたスタック領域のベース(底)を示します。関数が呼ばれた時点では、rbpには呼び出し元の関数のベースポインタの値が格納されているので、それを最初にpushすることで保存しているわけです。

mov %rsp,%rbp

続いて登場するrspはスタックポインタと呼ばれるレジスタで、スタックの最上段(最も最後に参照された位置)を示します。この値をrbpに代入することで、いまのスタックポインタをこの関数におけるベースポインタとしています。

movl $0x1,-0xc(%rbp)

ここからはプログラムの中身に入っていきます。ここでは「int a = 1」に対応する命令として、movl命令により(rbp-0xc)のアドレスの内容に1を代入しています。ちなみに、ここでは変数aをint(=32bit)で宣言しているので、アセンブラ上もmovl命令が使われています。

movl $0x2,-0x8(%rbp)

続いては「int b = 2」に対応する命令です。さきほどと同様、movlにより(rbp-0x8)のアドレスの内容に2を代入しています。よく見ると、アドレスの位置が変数aから4バイト離れているので、変数aとbはメモリ上は連続した位置に置かれているようです。

mov -0xc(%rbp),%edx および mov -0x8(%rbp),%eax

続いて登場するedxとeaxは汎用レジスタと呼ばれており、計算処理などに利用されます。ここでは、変数a,bの値をそれらのレジスタに一時的に格納しています。

add %edx,%eax

ここでようやくa+bの計算が行われます。edxとeaxにはaとbの値が入っているので、eaxにa+bの結果が格納されます。

mov %eax,-0x4(%rbp)

ここでは、上で計算したa+bの結果(eax)を変数cとして(rbp-0x4)のアドレスの内容に代入しています。これで、変数a,b,cのすべてに値が入った状態となりました。

mov -0x4(%rbp),%eax

ここでは「return c」に対応する処理として、変数cの値を改めてeaxに代入しています。なぜeaxなのか疑問に思いましたが、どうやらeaxは汎用レジスタの中でも戻り値の格納に使うことが決められているようです。

pop %rbp および retq

ここまでで関数内の処理はすべて完了したので、あとは呼び出し元へと戻るだけです。呼び出し元のベースポインタは最初にpushして覚えているので、その値をpopしてrbpへと書き戻しています。こうすることで、呼び出し元からすれば関数の前後でベースポインタが変わらないようにできます。最後はretqで関数の呼び出し元へと戻って終了です。

まとめ

とても短いプログラムでしたが、逆アセンブルすると色々なことがわかって楽しいです(・∀・)

CPU内ではスタックが利用されていることは知っていましたが、具体的な使われ方まではイマイチ理解していなかったのでとても良い勉強になりました。次はもう少し複雑なプログラムでその中身を覗いてみたいと思います。

ではではノシ

関連記事

Linux

2019/10/6

Docker + Growiでイントラ向けWikiを立ち上げる

チーム開発をしていくうえで、課題の1つになるのが情報共有です。チームの歴史が長いと経験値は溜まっていきますが、それらが情報として整理されていないとメンバー交代時などに大きなコストが発生します。 そこで、イントラ向けのナレッジベース(Wiki)を探していたところ、Growiという良さげなOSSを見つけたので、お試し環境を立ち上げてみることにしました。手元の環境はUbuntu18.04ですが、Linuxであれば大体同じような手順になると思います。 目次1 Dockerのインストール2 Growiの準備2.1 ...

この記事を読む

Linux

2019/8/14

カゴヤVPSで自分専用の開発環境を立ち上げてみた

どこからでもアクセスできる自分専用の開発環境が欲しい…。 そんな願いを叶えるべく、VPSのことを調べていたのですが、いままで「なんか難しそう…」と尻込みしていました。しかし、最近は値段も安くて扱いやすいVPSも増えてきたので、この機会に試してみることにしました。 ということで、今回はVPSを契約して最低限の環境を立ち上げるまでの備忘録です。 目次1 VPSについて1.1 VPSって何?1.2 カゴヤのVPSを契約してみた2 手順1:インスタンスを立ち上げる3 手順2:インスタンスにSSH接続する4 手順3 ...

この記事を読む

Windows

2019/5/5

Windows10で不要なブートエントリを削除する

Windowsのブートまわりで少しハマったので覚え書きです。 私のメインPCはWindows10とUbuntuのデュアルブートだったのですが、とある事情でUbuntuを削除しWindowsのみの構成に戻すことにしました。ちなみに、デュアルブート時の環境はこんな感じ(だったはず)。 元に戻したくなったときのことを考え、別HDD(ドライブB)にUbuntuとGRUBを入れ、GRUB経由でWindowsとUbuntuを立ち上げる形にしていました。 そのため、起動ドライブをWindowsのドライブ(ドライブA)に ...

この記事を読む

C言語 プログラミング

2018/12/25

mmapの下処理にftruncate関数を利用する

以前このブログで公開した記事の中に、C言語のmmap関数の使い方についてまとめた記事がありました。 Corgi Lab. ~備忘録のための技術ブログ~  3 shares 3 users 4 pocketsファイルの読み書きにmmapを使ってみるプログラムのループ中でファイルに何かしらのデータを書き込むとき、そのたびにwriteをしていたのではディスクへのI/Oが頻発してしまい、パフォーマンスに影響することがあります。「C言語だとそんなときはmmapを使うと良い」と ...

この記事を読む

Mac Linux

2018/12/2

Mac mini (2012) にUbuntu18.04をインストールしてみた

今年のアップデートにより、ついに旧型となってしまったMac mini(2012年モデル)。私の自宅にも箱に収められたままひっそりと眠るMac miniがありました。 約6年前のモデルと言うことで、最近のマシンから見ればスペック的に見劣りするPCになってしまいましたが、Linux機として運用するならまだまだ輝けるはず! ということで、今回はMac miniをUbuntu専用マシンとして復活させてみたので、その備忘録です。 目次1 用意するもの2 Ubuntuのインストール3 インストール後のセットアップ3. ...

この記事を読む

-C言語, プログラミング

Copyright© Corgi Lab. ~備忘録のための技術ブログ~ , 2019 All Rights Reserved.