Article Index |
---|
Tối ưu hóa mã nguồn C/ C++ – Optimize source code C/ C++ |
2 |
All Pages |
Khi bắt đầu viết một chương trình bằng một ngôn ngữ nào đó, thông thường bạn chỉ chú trọng vào việc hoàn tất các tính năng của chương trình yêu cầu, việc tối ưu nó được đặt ra sau khi bạn hoàn thành chương trình đó.
Khi đó việc tối ưu chương trình sẽ gặp những khó khăn nhất định. Do đó trong khi viết code bạn nên tạo cho mình một thói quen sao cho mã nguồn được tối ưu trong những trường hợp cơ bản. Bài viết này sẽ trình bày về tối ưu hóa mã nguồn trong C/C++, tại sao phải tối ưu hóa mã nguồn? tối ưu hóa mã nguồn như thế nào? Nó đem lại lợi ích gì cho người lập trình?… Những câu hỏi đó sẽ được trả lời trong bài viết này.
1. Tại sao phải tối ưu mã lệnh?
- Sự ra đời của các trình biên dịch hiện đại đã giúp lập trình viên cải thiện đáng kể thời
gian và công sức phát triển phần mềm. Một vấn đề đáng quan tâm là xu hướng phát
triển phần mềm theo hướng trực quan nhanh và tiện dụng dần làm mặt bằng kĩ năng
viết mã lệnh của các lập trình viên giảm rõ rệt vì họ trông cậy hoàn toàn vào sự hỗ trợ
của trình biên dịch. Khi phát triển một hệ thống phần mềm có tần suất xử lý cao, ví dụ
các sản phẩm có chức năng điều phối hoạt động dây chuyền sản xuất trong nhà máy,
thì bên cạnh sự hỗ trợ của một trình biên dịch mạnh còn cần đến kĩ năng tối ưu mã
lệnh của lập trình viên. Kĩ năng tốt sẽ biến công việc lập trình khô khan, với các đoạn
code tưởng chừng lạnh lùng trở nên sinh động. Một đoạn mã lệnh tốt sẽ tận dụng tối
đa ưu điểm của ngôn ngữ và khả năng xử lý của hệ thống, từ đó giúp nâng cao đáng
kể hiệu suất hoạt động của hệ thống.

- Để chương trình hoạt động tối ưu, điều đầu tiên là tận dụng những hỗ trợ sẵn có của
trình biên dịch thông qua các chỉ thị (directive) giúp tối ưu mã lệnh, tốc độ và kích
thước chương trình. Hầu hết các trình biên dịch phổ biến hiện nay đều hỗ trợ tốt việc
tối ưu mã khi biên dịch. Tuy nhiên, để đạt được hiệu quả tốt nhất, lập trình viên cần
tập cho mình thói quen tối ưu mã lệnh ngay từ khi bắt tay viết những chương trình đầu
tay. Bài viết này trình bày một số gợi ý rất cơ bản và kinh nghiệm thực tế tối ưu trong
lập trình bằng ngôn ngữ C/C++.
2. Tinh giản các biểu thức toán học.
- Các biểu thức toán học phức tạp khi được biên dịch có thể sinh ra nhiều mã dư thừa
làm tăng kích thước và chậm tốc độ thực hiện của chương trình. Do đó khi viết các
biểu thức phức tạp lập trình viên cần nhớ một số đặc điểm cơ bản sau để giúp tinh
giản biểu thức:
- CPU xử lý các phép tính cộng và trừ nhanh hơn các phép tính chia và nhân.
Ví dụ:
+ Biểu thức Total = (A*B + A*C + A*D) cần 2 phép cộng và 3 phép nhân. Ta có thể
nhóm các phép cộng và viết thành Total = A*(B+C+D), tốc độ tính nhanh hơn vì
giảm đi một phép tính nhân.
+ Biểu thức Total = (B/A + C/A) cần 2 phép chia có thể viết thành Total = (B+C)/A,
giúp giảm đi một phép chia.
- CPU xử lý tính toán với các số nguyên (integer) chậm hơn với số thực (float,
double), và tốc độ xử lý float nhanh hơn double.
- Trong một số trường hợp nhân hoặc chia số nguyên, sử dụng toán tử dời bit (bit
shifting) sẽ nhanh hơn toán tử nhân chia.
Ví dụ:
Biểu thức (A *= 128) có thể tận dụng toán tử dời bit sang trái thành (A <<= 7).
Một số trình biên dịch có khả năng tối ưu mã khi biên dịch như Visual C++ 6 hoặc
.Net 2003, biểu thức (A *= 128) và (A <<= 7) đều được biên dịch thành:
mov eax, A
shl eax, 7 (toán tử shl được dùng thay vì mul/imul)
mov A, eax
Ta có thể tối ưu bằng cách sử dụng mã assembly trực tiếp trong mã C/C++ như sau
(xem thêm thủ thuật tận dụng thế mạnh của C/C++ bên dưới):
__asm shl A, 7;
3. Tối ưu việc sử dụng biến tạm
- Đối với một số biểu thức tính toán số học phức tạp, trình biên dịch thường tạo các
biến tạm trong bộ nhớ để chứa kết quả tính toán và cuối cùng mới gán giá trị này cho
biến kết quả. Việc sử dụng biến tạm làm giảm tốc độ tính toán do phải cấp phát vùng
nhớ, tính toán và thực hiện việc gán kết quả cuối cùng. Để tránh việc sử dụng biến
tạm, ta có thể thực hiện việc tách các biểu thức phức tạp thành các biểu thức nhỏ hơn,
hoặc sử dụng các mẹo cho việc tính toán.
- Xem một ví dụ cộng các số nguyên sau:
A = B + C;
- Về cơ bản, khi thực hiện biểu thức này trình biên dịch tạo một biến tạm rồi thực hiện
cộng 2 giá trị B, C vào biến tạm này, cuối cùng sẽ gán kết quả cho A.
- Ta có thể viết lại biểu thức trên như sau để tránh sử dụng biến tạm làm chậm việc tính
toán:
A = B;
A += C;
Trong lập trình hướng đối tượng, theo thói quen đôi khi lập trình viên sử dụng các
biến tạm không cần thiết như trong ví dụ sau:
int MyFunc(const MyClass &A)
{
MyClass B;
B = A;
return B.value;
}
- Trong hàm trên, khi biến tạm B kiểu MyClass được khởi tạo thì constructor mặc định
sẽ được thực hiện. Sau đó B được gán giá trị của biến A thông qua việc sử dụng toán
tử =, khi đó copy constructor sẽ được gọi. Tuy nhiên với yêu cầu của bài toán thì việc
này không cần thiết, ta có thể viết lại như sau:
int MyFunc(const MyClass &A)
{
return A.value;
}
- Dưới đây là một ví dụ khác cho bài toán hoán vị giá trị 2 số nguyên A và B. Thông
thường, yêu cầu này sẽ được viết như sau:
int A = 7, B = 8;
int nTemp; //biến tạm
nTemp = A;
A = B;
B = nTemp;
- Tuy nhiên, bạn có thể sử dụng mẹo sau để tránh sử dụng biến tạm và tăng tốc tính
toán:
+ Sử dụng toán tử XOR:
A = A^B;
B = A^B;
A = A^B;
+ Sử dụng phép cộng, trừ
nX = nX + nY;
nY = nX - nY;
nX = nX - nY;
- Bạn hãy chạy thử đoạn mã lệnh trên sẽ thấy điều bất ngờ thú vị khi bài toán hoán vị
được giải quyết hết sức đơn giản.
- Thủ thuật tránh sử dụng biến tạm cần áp dụng linh động tùy thuộc kiểu dữ liệu, đặc
biệt các loại dữ liệu phức tạp như kiểu structure, string… có cơ chế lưu trữ và xử lý
riêng. Đối với các trình biên dịch hiện đại, việc tối ưu theo cách này đôi khi không
cần thiết vì trình biên dịch đã hỗ trợ sẵn cơ chế tối ưu này khi biên dịch mã lệnh.
4. Tối ưu các biểu thức điều kiện và luận lý
- Biểu thức điều kiện là thành phần không thể thiếu ở hầu hết các chương trình máy
tính vì nó giúp lập trình viên biểu diễn và xử lý được các trạng thái của thế giới thực
dưới dạng các mã lệnh máy tính. Những điều kiện dư thừa có thể làm chậm việc tính
toán và gia tăng kích thước mã lệnh, thậm chí có những đoạn mã có xác suất xảy ra
rất thấp. Một trong những tiêu chí quan trọng của việc tối ưu các biểu thức điều kiện
là đưa các điều kiện có xác suất xảy ra cao nhất, tính toán nhanh nhất lên đầu biểu
thức.
- Đối với các biểu thức luận lý, ta có thể linh động chuyển các biểu thức điều kiện đơn
giản và xác suất xảy ra cao hơn lên trước, các điều kiện kiểm tra phức tạp ra sau.
- Ví dụ: Biểu thức logic ((A || B ) && C ) có thể viết thành (C && ( A || B )) vì điều
kiện C chỉ cần một phép kiểm tra TRUE, trong khi điều kiện (A || B) cần đến 2 phép
kiểm tra TRUE và một phép OR (||). Như vậy trong trường hợp C có giá trị FALSE,
biểu thức logic này sẽ có kết quả FALSE và không cần kiểm tra thêm giá trị (A || B).
- Đối với các biểu thức kiểm tra điều kiện phức tạp, ta có thể viết đảo ngược bằng cách
kiểm tra các giá trị cho kết quả không thoả trước, giúp tăng tốc độ kiểm tra.
Ví dụ: Kiểm tra một giá trị thuộc một miền giá trị cho trước.
if (p <= max && p >= min && q <= max && q >= min)
{
//thực hiện khi thoả miền giá trị
}
else //không thoả
{
//thực hiện khi không thoả miền giá trị
}
Có thể viết thành:
if (p > max || p < min || q > max || q < min)
{
}
else
{
}
5. Tránh các tính toán lặp lại trong biểu thức điều kiện
Ví dụ:
if ((mydata->MyFunc() ) < min)
{
// ...
}
else if ((mydata->MyFunc() ) > max)
{
// ...
}
- Ta có thể chuyển hàm MyFunc ra ngoài biểu thức điều kiệu như sau:
int temp_value = mydata->MyFunc();
if (temp_value < min)
{
// ...
}
else if (temp_value > max)
{
// ...
}
- Đối với biểu thức điều kiện dạng switch…case: nếu các giá trị cho case liên tục nhau,
trình biên dịch sẽ tạo ra bảng ánh xạ (còn gọi là jump table) giúp việc truy xuất đến
từng điều kiện nhanh hơn và giảm kích thước mã lệnh. Tuy nhiên khi các giá trị
không liên tục, trình biên dịch sẽ tạo một chuỗi các phép toán so sánh, từ đó gây chậm
việc xử lý:
Ví dụ sau cho kết quả truy xuất tối ưu khi sử dụng switch…case:
int my_value;
switch (my_value)
{
case A:
//...
break;
case B:
//...
break;
case C:
//...
break;
case D:
//...
default: //...
}
- Trong trường hợp các giá trị dùng cho case không liên tục, ta có thể viết thành các
biểu thức if…elseif…else như sau:
switch (my_value)
{
case A:
//...
break;
case F:
//...
break;
case T:
}
- Có thể viết thành:
if (my_value == A)
{
// xử lý cho trường hợp A
}
else if (my_value == F)
{
// xử lý cho trường hợp F
}
else
{
// các trường hợp khác
}