Cách sử dụng Slither để tìm lỗi của hợp đồng thông minh

Solidity

hợp đồng thông minh

tính bảo mật

kiểm thử

Nâng cao

Trailofbits

Building secure contracts

9 tháng 6, 2020

10 số phút đọc

Cách sử dụng Slither

Mục đích của hướng dẫn này là chỉ ra cách sử dụng Slither để tự động tìm lỗi trong hợp đồng thông minh.

Cài đặt
Sử dụng dòng lệnh
Giới thiệu về phân tích tĩnh: Giới thiệu ngắn gọn về phân tích tĩnh
API: Mô tả API Python

Cài đặt

Slither yêu cầu Python >= 3.6. Nó có thể được cài đặt thông qua pip hoặc sử dụng docker.

Slither qua pip:

pip3 install --user slither-analyzer

Slither qua docker:

docker pull trailofbits/eth-security-toolbox
docker run -it -v "$PWD":/home/trufflecon trailofbits/eth-security-toolbox

Lệnh cuối cùng chạy eth-security-toolbox trong một docker có quyền truy cập vào thư mục hiện tại của bạn. Bạn có thể thay đổi tệp từ máy chủ lưu trữ của mình và chạy các công cụ trên tệp từ docker

Bên trong docker, chạy:

solc-select 0.5.11
cd /home/trufflecon/

Chạy một tập lệnh

Để chạy một tập lệnh python bằng python 3:

python3 script.py

Dòng lệnh

Dòng lệnh so với các tập lệnh do người dùng xác định. Slither đi kèm với một bộ các công cụ dò tìm được xác định trước để tìm nhiều lỗi phổ biến. Việc gọi Slither từ dòng lệnh sẽ chạy tất cả các công cụ dò tìm, không cần kiến thức chi tiết về phân tích tĩnh:

slither project_paths

Ngoài các công cụ dò tìm, Slither còn có các khả năng xem xét mã thông qua các printers (opens in a new tab) và công cụ (opens in a new tab) của nó.

Sử dụng crytic.io (opens in a new tab) để có quyền truy cập vào các công cụ dò tìm riêng tư và tích hợp GitHub.

Phân tích tĩnh

Các khả năng và thiết kế của khung phân tích tĩnh Slither đã được mô tả trong các bài đăng trên blog (1 (opens in a new tab), 2 (opens in a new tab)) và một bài báo học thuật (opens in a new tab).

Phân tích tĩnh tồn tại ở nhiều dạng khác nhau. Bạn có thể nhận ra rằng các trình biên dịch như clang (opens in a new tab) và gcc (opens in a new tab) phụ thuộc vào các kỹ thuật nghiên cứu này, nhưng nó cũng làm nền tảng cho (Infer (opens in a new tab), CodeClimate (opens in a new tab), FindBugs (opens in a new tab) và các công cụ dựa trên các phương pháp chính thức như Frama-C (opens in a new tab) và Polyspace (opens in a new tab).

Chúng tôi sẽ không xem xét một cách toàn diện các kỹ thuật phân tích tĩnh và nhà nghiên cứu ở đây. Thay vào đó, chúng tôi sẽ tập trung vào những gì cần thiết để hiểu cách Slither hoạt động để bạn có thể sử dụng nó hiệu quả hơn để tìm lỗi và hiểu mã.

Biểu diễn mã
Phân tích mã
Biểu diễn trung gian

Biểu diễn mã

Trái ngược với phân tích động, vốn chỉ lý giải về một đường dẫn thực thi duy nhất, phân tích tĩnh lý giải về tất cả các đường dẫn cùng một lúc. Để làm được điều đó, nó dựa vào một biểu diễn mã khác. Hai loại phổ biến nhất là cây cú pháp trừu tượng (AST) và đồ thị luồng điều khiển (CFG).

Cây cú pháp trừu tượng (AST)

AST được sử dụng mỗi khi trình biên dịch phân tích cú pháp mã. Đây có lẽ là cấu trúc cơ bản nhất mà trên đó có thể thực hiện phân tích tĩnh.

Tóm lại, AST là một cây có cấu trúc, trong đó, mỗi lá thường chứa một biến hoặc một hằng số và các nút bên trong là toán hạng hoặc các toán tử luồng điều khiển. Hãy xem xét mã sau:

1function safeAdd(uint a, uint b) pure internal returns(uint){
2    if(a + b <= a){
3        revert();
4    }
5    return a + b;
6}

AST tương ứng được hiển thị trong:

Slither sử dụng AST được xuất bởi solc.

Mặc dù dễ xây dựng, AST là một cấu trúc lồng nhau. Đôi khi, đây không phải là cách phân tích đơn giản nhất. Ví dụ: để xác định các toán tử được sử dụng bởi biểu thức a + b <= a, trước tiên bạn phải phân tích <= rồi đến +. Một cách tiếp cận phổ biến là sử dụng cái gọi là mẫu visitor (visitor pattern), điều hướng qua cây một cách đệ quy. Slither chứa một visitor chung trong ExpressionVisitor (opens in a new tab).

Mã sau sử dụng ExpressionVisitor để phát hiện xem biểu thức có chứa phép cộng hay không:

1from slither.visitors.expression.expression import ExpressionVisitor
2from slither.core.expressions.binary_operation import BinaryOperationType
3
4class HasAddition(ExpressionVisitor):
5
6    def result(self):
7        return self._result
8
9    def _post_binary_operation(self, expression):
10        if expression.type == BinaryOperationType.ADDITION:
11            self._result = True
12
13visitor = HasAddition(expression) # expression là biểu thức cần được kiểm tra
14print(f'Biểu thức {expression} có một phép cộng: {visitor.result()}')
Hiện tất cả

Đồ thị luồng điều khiển (CFG)

Biểu diễn mã phổ biến thứ hai là đồ thị luồng điều khiển (CFG). Đúng như tên gọi của nó, đây là một biểu diễn dựa trên đồ thị, thể hiện tất cả các đường dẫn thực thi. Mỗi nút chứa một hoặc nhiều lệnh. Các cạnh trong đồ thị biểu thị các toán tử luồng điều khiển (if/then/else, vòng lặp, v.v.). CFG của ví dụ trước của chúng tôi là:

CFG là biểu diễn mà hầu hết các phân tích được xây dựng trên đó.

Nhiều biểu diễn mã khác tồn tại. Mỗi biểu diễn đều có ưu và nhược điểm tùy theo phân tích bạn muốn thực hiện.

Phân tích

Loại phân tích đơn giản nhất bạn có thể thực hiện với Slither là phân tích cú pháp.

Phân tích cú pháp

Slither có thể điều hướng qua các thành phần khác nhau của mã và biểu diễn của chúng để tìm ra những điểm không nhất quán và thiếu sót bằng cách sử dụng phương pháp tiếp cận giống như so khớp mẫu.

Ví dụ: các công cụ dò tìm sau đây tìm kiếm các vấn đề liên quan đến cú pháp:

Che biến trạng thái (opens in a new tab): lặp qua tất cả các biến trạng thái và kiểm tra xem có bất kỳ biến nào che một biến từ một hợp đồng được kế thừa hay không (state.py#L51-L62 (opens in a new tab))
Giao diện ERC20 không chính xác (opens in a new tab): tìm kiếm các chữ ký hàm ERC20 không chính xác (incorrect_erc20_interface.py#L34-L55 (opens in a new tab))

Phân tích ngữ nghĩa

Trái ngược với phân tích cú pháp, phân tích ngữ nghĩa sẽ đi sâu hơn và phân tích “ý nghĩa” của mã. Họ này bao gồm một số loại phân tích rộng. Chúng dẫn đến kết quả mạnh mẽ và hữu ích hơn, nhưng cũng phức tạp hơn để viết.

Các phân tích ngữ nghĩa được sử dụng để phát hiện các lỗ hổng bảo mật tiên tiến nhất.

Phân tích phụ thuộc dữ liệu

Một biến variable_a được cho là phụ thuộc dữ liệu vào variable_b nếu có một đường dẫn mà giá trị của variable_a bị ảnh hưởng bởi variable_b.

Trong mã sau đây, variable_a phụ thuộc vào variable_b:

1// ...
2variable_a = variable_b + 1;

Slither đi kèm với các khả năng phụ thuộc dữ liệu (opens in a new tab) tích hợp sẵn, nhờ vào biểu diễn trung gian của nó (sẽ được thảo luận trong phần sau).

Một ví dụ về việc sử dụng phụ thuộc dữ liệu có thể được tìm thấy trong công cụ dò tìm đẳng thức nghiêm ngặt nguy hiểm (opens in a new tab). Ở đây Slither sẽ tìm kiếm so sánh đẳng thức nghiêm ngặt với một giá trị nguy hiểm (incorrect_strict_equality.py#L86-L87 (opens in a new tab)) và sẽ thông báo cho người dùng rằng nên sử dụng >= hoặc <= thay vì ==, để ngăn kẻ tấn công bẫy hợp đồng. Trong số những thứ khác, công cụ dò tìm sẽ coi giá trị trả về của một lệnh gọi đến balanceOf(address) là nguy hiểm (incorrect_strict_equality.py#L63-L64 (opens in a new tab)) và sẽ sử dụng công cụ phụ thuộc dữ liệu để theo dõi việc sử dụng nó.

Tính toán điểm cố định

Nếu phân tích của bạn điều hướng qua CFG và đi theo các cạnh, bạn có thể sẽ thấy các nút đã được truy cập. Ví dụ: nếu một vòng lặp được trình bày như hình dưới đây:

1for(uint i; i < range; ++){
2    variable_a += 1
3}

Phân tích của bạn sẽ cần biết khi nào nên dừng lại. Có hai chiến lược chính ở đây: (1) lặp lại trên mỗi nút một số lần hữu hạn, (2) tính toán một cái gọi là điểm cố định. Một điểm cố định về cơ bản có nghĩa là việc phân tích nút này không cung cấp bất kỳ thông tin có ý nghĩa nào.

Một ví dụ về điểm cố định được sử dụng có thể được tìm thấy trong các công cụ dò tìm tái nhập: Slither khám phá các nút và tìm kiếm các lệnh gọi bên ngoài, ghi và đọc vào bộ nhớ lưu trữ. Khi đã đạt đến điểm cố định (reentrancy.py#L125-L131 (opens in a new tab)), nó sẽ dừng việc khám phá và phân tích kết quả để xem liệu có tồn tại tình trạng tái nhập hay không, thông qua các mẫu tái nhập khác nhau (reentrancy_benign.py (opens in a new tab), reentrancy_read_before_write.py (opens in a new tab), reentrancy_eth.py (opens in a new tab)).

Việc viết các phân tích sử dụng tính toán điểm cố định hiệu quả đòi hỏi sự hiểu biết tốt về cách phân tích truyền bá thông tin của nó.

Biểu diễn trung gian

Biểu diễn trung gian (IR) là một ngôn ngữ được thiết kế để dễ dàng phân tích tĩnh hơn so với ngôn ngữ gốc. Slither dịch Solidity sang IR của riêng nó: SlithIR (opens in a new tab).

Việc hiểu SlithIR là không cần thiết nếu bạn chỉ muốn viết các kiểm tra cơ bản. Tuy nhiên, nó sẽ hữu ích nếu bạn có kế hoạch viết các phân tích ngữ nghĩa nâng cao. Các printers SlithIR (opens in a new tab) và SSA (opens in a new tab) sẽ giúp bạn hiểu cách mã được dịch.

Kiến thức cơ bản về API

Slither có một API cho phép bạn khám phá các thuộc tính cơ bản của hợp đồng và các hàm của nó.

Để tải một codebase:

1from slither import Slither
2slither = Slither('/path/to/project')
3

Khám phá các hợp đồng và hàm

Một đối tượng Slither có:

contracts (list(Contract): danh sách các hợp đồng
contracts_derived (list(Contract): danh sách các hợp đồng không được kế thừa bởi một hợp đồng khác (tập hợp con của các hợp đồng)
get_contract_from_name (str): Trả về một hợp đồng từ tên của nó

Một đối tượng Contract có:

name (str): Tên của hợp đồng
functions (list(Function)): Danh sách các hàm
modifiers (list(Modifier)): Danh sách các bộ sửa đổi
all_functions_called (list(Function/Modifier)): Danh sách tất cả các hàm nội bộ mà hợp đồng có thể truy cập được
inheritance (list(Contract)): Danh sách các hợp đồng được kế thừa
get_function_from_signature (str): Trả về một hàm từ chữ ký của nó
get_modifier_from_signature (str): Trả về một bộ sửa đổi từ chữ ký của nó
get_state_variable_from_name (str): Trả về một biến trạng thái từ tên của nó

Một đối tượng Function hoặc Modifier có:

name (str): Tên của hàm
contract (contract): hợp đồng nơi hàm được khai báo
nodes (list(Node)): Danh sách các nút cấu thành CFG của hàm/bộ sửa đổi
entry_point (Node): Điểm vào của CFG
variables_read (list(Variable)): Danh sách các biến đã đọc
variables_written (list(Variable)): Danh sách các biến đã ghi
state_variables_read (list(StateVariable)): Danh sách các biến trạng thái đã đọc (tập hợp con của các biến đã đọc)
state_variables_written (list(StateVariable)): Danh sách các biến trạng thái đã ghi (tập hợp con của các biến đã ghi)

Lần cập nhật trang lần cuối: 3 tháng 2, 2025