スリザーを使用してスマートコントラクトのバグを見つける方法
スリザーの使用方法
このチュートリアルの目的は、スリザーを使用してスマートコントラクトのバグを自動的に見つける方法を示すことです。
- インストール
- コマンドラインでの使用
- 静的解析の概要: 静的解析の簡単な紹介
- API: Python APIの説明
インストール
スリザーにはPython 3.6以上が必要です。pipまたはDockerを使用してインストールできます。
pipを使用したスリザーのインストール:
pip3 install --user slither-analyzer
Dockerを使用したスリザーのインストール:
docker pull trailofbits/eth-security-toolbox
docker run -it -v "$PWD":/home/trufflecon trailofbits/eth-security-toolbox
最後のコマンドは、現在のディレクトリにアクセスできるDocker内でeth-security-toolboxを実行します。ホストからファイルを変更し、Dockerからそのファイルに対してツールを実行できます。
Docker内で以下を実行します:
solc-select 0.5.11
cd /home/trufflecon/
スクリプトの実行
Python 3でPythonスクリプトを実行するには:
python3 script.py
コマンドライン
コマンドラインとユーザー定義スクリプトの比較。 スリザーには、多くの一般的なバグを見つけるための事前定義された検出器のセットが付属しています。コマンドラインからスリザーを呼び出すと、すべての検出器が実行されるため、静的解析に関する詳細な知識は必要ありません。
slither project_paths
検出器に加えて、スリザーにはプリンター (opens in a new tab)とツール (opens in a new tab)によるコードレビュー機能があります。
プライベート検出器やGitHub統合にアクセスするには、crytic.io (opens in a new tab)を使用してください。
静的解析
スリザーの静的解析フレームワークの機能と設計については、ブログ記事(1 (opens in a new tab)、2 (opens in a new tab))および学術論文 (opens in a new tab)で説明されています。
静的解析にはさまざまな種類があります。clang (opens in a new tab)やgcc (opens in a new tab)のようなコンパイラがこれらの研究技術に依存していることはご存知かもしれませんが、Infer (opens in a new tab)、CodeClimate (opens in a new tab)、FindBugs (opens in a new tab)、およびFrama-C (opens in a new tab)やPolyspace (opens in a new tab)のような形式手法に基づくツールの基盤にもなっています。
ここでは、静的解析の技術や研究について網羅的にレビューすることはしません。代わりに、バグを見つけたりコードを理解したりするためにスリザーをより効果的に使用できるよう、スリザーの仕組みを理解するために必要なことに焦点を当てます。
コード表現
単一の実行パスについて推論する動的解析とは対照的に、静的解析はすべてのパスについて一度に推論します。そのためには、異なるコード表現に依存します。最も一般的な2つは、抽象構文木(AST)と制御フローグラフ(CFG)です。
抽象構文木(AST)
ASTは、コンパイラがコードを解析するたびに使用されます。これはおそらく、静的解析を実行できる最も基本的な構造です。
簡単に言えば、ASTは構造化されたツリーであり、通常、各葉には変数または定数が含まれ、内部ノードはオペランドまたは制御フロー操作です。次のコードを考えてみましょう。
function safeAdd(uint a, uint b) pure internal returns(uint){
if(a + b <= a){
revert();
}
return a + b;
}
対応するASTは以下のようになります。
スリザーはsolcによってエクスポートされたASTを使用します。
構築は簡単ですが、ASTはネストされた構造です。そのため、解析が最も簡単ではない場合があります。たとえば、式a + b <= aで使用される操作を特定するには、まず<=を解析し、次に+を解析する必要があります。一般的なアプローチは、ツリーを再帰的にナビゲートする、いわゆるビジターパターンを使用することです。スリザーには、ExpressionVisitor (opens in a new tab)に汎用ビジターが含まれています。
次のコードは、ExpressionVisitorを使用して、式に加算が含まれているかどうかを検出します。
from slither.visitors.expression.expression import ExpressionVisitor
from slither.core.expressions.binary_operation import BinaryOperationType
class HasAddition(ExpressionVisitor):
def result(self):
return self._result
def _post_binary_operation(self, expression):
if expression.type == BinaryOperationType.ADDITION:
self._result = True
visitor = HasAddition(expression) # expressionはテスト対象の式です
print(f'The expression {expression} has a addition: {visitor.result()}')
制御フローグラフ(CFG)
2番目に一般的なコード表現は、制御フローグラフ(CFG)です。その名の通り、すべての実行パスを公開するグラフベースの表現です。各ノードには1つまたは複数の命令が含まれます。グラフ内のエッジは、制御フロー操作(if/then/else、ループなど)を表します。前の例のCFGは次のとおりです。
CFGは、ほとんどの解析が構築される基盤となる表現です。
他にも多くのコード表現が存在します。実行したい解析に応じて、各表現には長所と短所があります。
解析
スリザーで実行できる最も単純なタイプの解析は、構文解析です。
構文解析
スリザーは、パターンマッチングのようなアプローチを使用して、コードのさまざまなコンポーネントとその表現をナビゲートし、不整合や欠陥を見つけることができます。
たとえば、次の検出器は構文関連の問題を探します。
-
状態変数のシャドウイング (opens in a new tab): すべての状態変数を反復処理し、継承されたコントラクトの変数をシャドウイングしているものがないか確認します(state.py#L51-L62 (opens in a new tab))
-
不正確なERC-20インターフェース (opens in a new tab): 不正確なERC-20関数の署名を探します(incorrect_erc20_interface.py#L34-L55 (opens in a new tab))
セマンティック解析
構文解析とは対照的に、セマンティック解析はより深く掘り下げ、コードの「意味」を解析します。このファミリーには、いくつかの幅広いタイプの解析が含まれます。これらはより強力で有用な結果をもたらしますが、記述するのもより複雑になります。
セマンティック解析は、最も高度な脆弱性検出に使用されます。
データ依存性解析
変数variable_aの値がvariable_bの影響を受けるパスが存在する場合、変数variable_aはvariable_bにデータ依存していると言われます。
次のコードでは、variable_aはvariable_bに依存しています。
// ...
variable_a = variable_b + 1;
スリザーには、中間表現(後のセクションで説明します)のおかげで、組み込みのデータ依存性 (opens in a new tab)機能が備わっています。
データ依存性の使用例は、危険な厳密等価検出器 (opens in a new tab)で見ることができます。ここでスリザーは、危険な値との厳密な等価比較(incorrect_strict_equality.py#L86-L87 (opens in a new tab))を探し、攻撃者がコントラクトを罠にかけるのを防ぐために、==ではなく>=または<=を使用する必要があることをユーザーに通知します。とりわけ、この検出器はbalanceOf(address)への呼び出しの戻り値(incorrect_strict_equality.py#L63-L64 (opens in a new tab))を危険と見なし、データ依存性エンジンを使用してその使用状況を追跡します。
不動点計算
解析がCFGをナビゲートし、エッジをたどる場合、すでに訪問したノードに遭遇する可能性があります。たとえば、以下に示すようなループが存在する場合です。
for(uint i; i < range; ++){
variable_a += 1
}
解析はいつ停止すべきかを知る必要があります。ここには2つの主な戦略があります。(1)各ノードを有限回反復する、(2)いわゆる_不動点(fixpoint)_を計算する。不動点とは基本的に、このノードを解析しても意味のある情報が得られないことを意味します。
使用される不動点の例は、リエントランシー検出器で見ることができます。スリザーはノードを探索し、外部呼び出し、ストレージへの書き込みと読み取りを探します。不動点(reentrancy.py#L125-L131 (opens in a new tab))に達すると探索を停止し、さまざまなリエントランシーパターン(reentrancy_benign.py (opens in a new tab)、reentrancy_read_before_write.py (opens in a new tab)、reentrancy_eth.py (opens in a new tab))を通じて結果を解析し、リエントランシーが存在するかどうかを確認します。
効率的な不動点計算を使用して解析を記述するには、解析がどのように情報を伝播するかをよく理解する必要があります。
中間表現
中間表現(IR)は、元の言語よりも静的解析に適した言語です。スリザーはSolidityを独自のIRであるSlithIR (opens in a new tab)に変換します。
基本的なチェックのみを記述したい場合は、SlithIRを理解する必要はありません。ただし、高度なセマンティック解析を記述する予定がある場合は役立ちます。SlithIR (opens in a new tab)およびSSA (opens in a new tab)プリンターは、コードがどのように変換されるかを理解するのに役立ちます。
APIの基本
スリザーには、コントラクトとその関数の基本的な属性を探索できるAPIがあります。
コードベースをロードするには:
from slither import Slither
slither = Slither('/path/to/project')
コントラクトと関数の探索
Slitherオブジェクトには以下が含まれます:
contracts (list(Contract): コントラクトのリストcontracts_derived (list(Contract): 他のコントラクトに継承されていないコントラクトのリスト(コントラクトのサブセット)get_contract_from_name (str): 名前からコントラクトを返す
Contractオブジェクトには以下が含まれます:
name (str): コントラクトの名前functions (list(Function)): 関数のリストmodifiers (list(Modifier)): 関数のリストall_functions_called (list(Function/Modifier)): コントラクトから到達可能なすべての内部関数のリストinheritance (list(Contract)): 継承されたコントラクトのリストget_function_from_signature (str): 署名から関数を返すget_modifier_from_signature (str): 署名から修飾子を返すget_state_variable_from_name (str): 名前から状態変数を返す
FunctionまたはModifierオブジェクトには以下が含まれます:
name (str): 関数の名前contract (contract): 関数が宣言されているコントラクトnodes (list(Node)): 関数/修飾子のCFGを構成するノードのリストentry_point (Node): CFGのエントリポイントvariables_read (list(Variable)): 読み取られた変数のリストvariables_written (list(Variable)): 書き込まれた変数のリストstate_variables_read (list(StateVariable)): 読み取られた状態変数のリスト(variables`readのサブセット)state_variables_written (list(StateVariable)): 書き込まれた状態変数のリスト(variables`writtenのサブセット)

