mod_rewrite
của Apache cho phép bạn viết lại URL theo cách gọn gàng hơn, dịch các đường dẫn mà con người có thể đọc được thành các chuỗi truy vấn thân thiện với mã. Nó cũng cho phép bạn viết lại URL dựa trên các điều kiện. Tệp .htaccess
cho phép bạn tạo và áp dụng luật viết lại mà không cần truy cập file cấu hình server . Bằng cách đặt .htaccess
vào folder root của trang web , bạn có thể quản lý các đoạn viết lại trên cơ sở từng trang hoặc từng folder .
Trong hướng dẫn này, bạn sẽ bật mod_rewrite
và sử dụng các .htaccess
để tạo chuyển hướng URL cơ bản, sau đó khám phá một vài trường hợp sử dụng nâng cao.
Để làm theo hướng dẫn này, bạn cần :
Một server Ubuntu 18.04 được cài đặt theo hướng dẫn cài đặt server ban đầu Ubuntu 18.04 , bao gồm user không phải root có quyền sudo và firewall .
Đã cài đặt Apache theo Bước 1 của Cách cài đặt ngăn xếp Linux, Apache, MySQL, PHP (LAMP) trên Ubuntu 18.04 .
Để Apache hiểu các luật viết lại, trước tiên ta cần kích hoạt mod_rewrite
. Nó đã được cài đặt, nhưng nó bị tắt trên cài đặt Apache mặc định. Sử dụng lệnh a2enmod
để bật module :
- sudo a2enmod rewrite
Thao tác này sẽ kích hoạt module hoặc thông báo cho bạn biết rằng module đã được bật. Để những thay đổi này có hiệu lực, hãy khởi động lại Apache.
- sudo systemctl restart apache2
mod_rewrite
hiện đã được kích hoạt hoàn toàn. Trong bước tiếp theo, ta sẽ cài đặt .htaccess
mà ta sẽ sử dụng để xác định các luật viết lại cho chuyển hướng.
Tệp .htaccess
cho phép ta sửa đổi các luật viết lại của bạn mà không cần truy cập file cấu hình server . Vì lý do này, .htaccess
rất quan trọng đối với bảo mật ứng dụng web của bạn. Dấu chấm đứng trước tên file đảm bảo file được ẩn.
Lưu ý: Bất kỳ luật nào bạn có thể đặt trong .htaccess
cũng có thể được đặt trực tiếp vào file cấu hình server . Trên thực tế, tài liệu Apache chính thức khuyến nghị sử dụng các file cấu hình server thay vì .htaccess
vì Apache xử lý theo cách đó nhanh hơn.
Tuy nhiên, trong ví dụ đơn giản này, hiệu suất tăng sẽ không đáng kể. Ngoài ra, việc cài đặt các luật trong .htaccess
rất tiện lợi, đặc biệt là với nhiều trang web trên cùng một server . Nó không yêu cầu khởi động lại server để các thay đổi có hiệu lực và nó không yêu cầu quyền root để chỉnh sửa các luật đó, đơn giản hóa việc bảo trì và áp dụng các thay đổi có thể thực hiện được với account không có quyền . Một số phần mềm nguồn mở phổ biến, như Wordpress và Joomla, thường dựa vào .htaccess
để phần mềm sửa đổi và tạo các luật bổ sung theo yêu cầu.
Trước khi bắt đầu sử dụng .htaccess
, bạn cần cài đặt và bảo mật một số cài đặt khác.
Theo mặc định, Apache cấm sử dụng .htaccess
để áp dụng các luật viết lại, vì vậy trước tiên bạn cần cho phép các thay đổi đối với file . Mở file cấu hình Apache mặc định bằng nano
hoặc editor yêu thích của bạn.
- sudo nano /etc/apache2/sites-available/000-default.conf
Bên trong file đó, bạn sẽ tìm thấy một khối <VirtualHost *:80>
bắt đầu từ dòng đầu tiên. Bên trong khối đó, hãy thêm khối mới sau để file cấu hình của bạn trông giống như sau. Đảm bảo rằng tất cả các khối đều được thụt lề đúng cách.
<VirtualHost *:80> <Directory /var/www/html> Options Indexes FollowSymLinks MultiViews AllowOverride All Require all granted </Directory> . . . </VirtualHost>
Lưu và đóng file . Để những thay đổi này có hiệu lực, hãy khởi động lại Apache.
- sudo systemctl restart apache2
Bây giờ, hãy tạo một .htaccess
trong folder root của web.
- sudo nano /var/www/html/.htaccess
Thêm dòng này ở đầu file mới để kích hoạt công cụ viết lại.
RewriteEngine on
Lưu file và thoát.
Đến đây bạn có một .htaccess
hoạt động mà bạn có thể sử dụng để điều chỉnh các luật định tuyến của ứng dụng web của bạn. Trong bước tiếp theo, ta sẽ tạo các file trang web mẫu mà ta sẽ sử dụng để chứng minh các luật viết lại.
Ở đây, ta sẽ cài đặt một trình ghi lại URL cơ bản để chuyển đổi các URL đẹp thành đường dẫn thực tế đến các trang. Cụ thể, ta sẽ cho phép user truy cập http:// your_server_ip /about
, nhưng hiển thị trang có tên about.html
.
Bắt đầu bằng cách tạo một file có tên about.html
trong folder root của web.
- sudo nano /var/www/html/about.html
Sao chép mã HTML sau vào file , sau đó lưu và đóng nó.
<html> <head> <title>About Us</title> </head> <body> <h1>About Us</h1> </body> </html>
Bạn có thể truy cập trang này tại http:// your_server_ip /about.html
, nhưng lưu ý nếu bạn cố gắng truy cập vào http:// your_server_ip /about
, bạn sẽ thấy lỗi 404 Not Found . Để truy cập trang bằng cách sử dụng /about
thay vào đó, ta sẽ tạo luật viết lại.
Tất cả các RewriteRules
đều tuân theo định dạng sau:
RewriteRule pattern substitution [flags]
RewriteRule
chỉ định chỉ thị.pattern
là một biểu thức chính quy trùng với chuỗi mong muốn từ URL, là chuỗi mà người xem nhập vào trình duyệt.substitution
là đường dẫn đến URL thực, tức là đường dẫn của server Apache file .flags
là các tham số tùy chọn có thể sửa đổi cách luật hoạt động. Hãy tạo luật ghi lại URL của ta . Mở .htaccess
.
- sudo nano /var/www/html/.htaccess
Sau dòng đầu tiên, thêm RewriteRule
được đánh dấu màu đỏ và lưu file .
RewriteEngine on RewriteRule ^about$ about.html [NC]
Trong trường hợp này, ^about$
là mẫu, about.html
là thay thế và [NC]
là cờ. Ví dụ của ta sử dụng một vài ký tự có ý nghĩa đặc biệt:
^
cho biết phần bắt đầu của URL, sau your_server_ip /
.$
cho biết phần cuối của URL.about
trùng với chuỗi “about”.about.html
là file thực mà user truy cập.[NC]
là một cờ làm cho luật không phân biệt chữ hoa chữ thường. Như vậy, bạn có thể truy cập http:// your_server_ip /about
trong trình duyệt của bạn . Trên thực tế, với luật được hiển thị ở trên, các URL sau sẽ trỏ đến about.html
:
http:// your_server_ip /about
, do định nghĩa luật .http:// your_server_ip /About
, vì luật không phân biệt chữ hoa chữ thường.http:// your_server_ip /about.html
, vì tên file thích hợp ban đầu sẽ luôn hoạt động.Tuy nhiên, những điều sau sẽ không hoạt động:
http:// your_server_ip /about/
, bởi vì luật nói rõ rằng có thể không có gì sau about
, vì ký tự $
xuất hiện sau about
.http:// your_server_ip /contact
, vì nó sẽ không trùng với chuỗi about
trong luật . Đến đây bạn có một .htaccess
hoạt động với luật cơ bản mà bạn có thể sửa đổi và mở rộng theo nhu cầu của bạn . Trong các phần sau, ta sẽ đưa ra hai ví dụ bổ sung về các lệnh thường được sử dụng.
Các ứng dụng web thường sử dụng các chuỗi truy vấn , được nối vào URL bằng dấu chấm hỏi ( ?
) Sau địa chỉ. Các tham số riêng biệt được phân tách bằng dấu và ( &
). Chuỗi truy vấn được dùng để chuyển dữ liệu bổ sung giữa các trang ứng dụng riêng lẻ.
Ví dụ: trang kết quả tìm kiếm được viết bằng PHP có thể sử dụng URL như http://example.com/results.php?item=shirt&season=summer
. Trong ví dụ này, hai tham số bổ sung được chuyển đến tập lệnh ứng dụng result.php
tưởng tượng: item
, với value shirt
và season
với value summer
. Ứng dụng có thể sử dụng thông tin chuỗi truy vấn để xây dựng trang phù hợp cho khách truy cập.
Các luật viết lại của Apache thường được sử dụng để đơn giản hóa các liên kết dài và khó hiểu như ở trên thành các URL thân thiện , dễ nhập và diễn giải trực quan hơn. Trong ví dụ này, ta muốn đơn giản hóa liên kết trên để trở thành http://example.com/shirt/summer
. Giá trị tham số shirt
và summer
vẫn có trong địa chỉ, nhưng không có chuỗi truy vấn và tên tập lệnh.
Đây là một luật để thực hiện điều này:
RewriteRule ^shirt/summer$ results.php?item=shirt&season=summer [QSA]
shirt/summer
được đối sánh rõ ràng trong địa chỉ được yêu cầu và Apache được yêu cầu phân phát results.php?item=shirt&season=summer
.
Cờ [QSA]
thường được sử dụng trong các luật viết lại. Họ yêu cầu Apache nối bất kỳ chuỗi truy vấn bổ sung nào vào URL được phục vụ, vì vậy nếu khách truy cập nhập http://example.com/shirt/summer? page=2
server sẽ trả lời với results.php?item=shirt&season=summer &page=2
. Nếu không có nó, chuỗi truy vấn bổ sung sẽ bị loại bỏ.
Trong khi phương pháp này đạt được hiệu quả mong muốn, cả tên mục và phần đều được mã hóa cứng vào luật . Điều này nghĩa là luật sẽ không áp dụng cho bất kỳ mặt hàng nào khác, như pants
hoặc các mùa, như winter
.
Để làm cho luật chung chung hơn, ta có thể sử dụng biểu thức chính quy để khớp các phần của địa chỉ root và sử dụng các phần đó trong một mẫu thay thế. Luật được sửa đổi sau đó sẽ trông như sau:
RewriteRule ^([A-Za-z0-9]+)/(summer|winter|fall|spring) results.php?item=$1&season=$2 [QSA]
Group biểu thức chính quy đầu tiên trong dấu ngoặc đơn trùng với một chuỗi có chứa các ký tự chữ và số như shirt
hoặc pants
và lưu phân đoạn đã so khớp dưới dạng biến $1
. Group biểu thức lại thông thường thứ hai trong ngoặc đơn đối sánh chính xác với summer
, winter
, fall
hoặc spring
và tương tự lưu phân đoạn đã khớp dưới dạng $2
.
Sau đó, các phân đoạn phù hợp được sử dụng trong URL kết quả trong các biến item
và season
thay vì các giá trị shirt
và summer
mà ta đã sử dụng trước đây.
Ở trên sẽ chuyển đổi, ví dụ: http://example.com/pants/summer
thành http://example.com/results.php?item=pants&season=summer
. Ví dụ này cũng là bằng chứng trong tương lai, cho phép các mục và phần thay đổi được viết lại chính xác bằng cách sử dụng một luật duy nhất.
Các luật viết lại không nhất thiết phải luôn được đánh giá từng cái một mà không có bất kỳ giới hạn nào. Chỉ thị RewriteCond
cho phép ta thêm điều kiện vào các luật viết lại của ta để kiểm soát thời điểm các luật sẽ được xử lý. Tất cả các RewriteConds
tuân theo định dạng sau:
RewriteCond TestString Condition [Flags]
RewriteCond
chỉ định chỉ thị RewriteCond
.TestString
là chuỗi để kiểm tra.Condition
là mẫu hoặc điều kiện để phù hợp.Flags
là các tham số tùy chọn có thể sửa đổi điều kiện và luật đánh giá. Nếu RewriteCond
đánh giá là true, thì RewriteRule
ngay sau đó sẽ được xem xét. Nếu không, luật sẽ bị loại bỏ. Nhiều RewriteCond
được dùng lần lượt và với hành vi mặc định, tất cả đều phải đánh giá là true để luật sau được xem xét.
Ví dụ: giả sử bạn muốn chuyển hướng tất cả các yêu cầu đến các file hoặc folder không tồn tại trên trang web trở lại trang chủ thay vì hiển thị trang lỗi 404 Not Found tiêu chuẩn. Điều này có thể đạt được với các luật điều kiện sau:
RewriteCond %{REQUEST_FILENAME} !-f RewriteCond %{REQUEST_FILENAME} !-d RewriteRule . /
Với những điều trên:
%{REQUEST_FILENAME}
là chuỗi cần kiểm tra. Trong trường hợp này, đó là tên file được yêu cầu, là một biến hệ thống có sẵn cho mọi yêu cầu.-f
là một điều kiện tích hợp để xác minh xem tên được yêu cầu có tồn tại trên đĩa và là một file hay không. Cái !
là một toán tử phủ định. Kết hợp !-f
chỉ có giá trị true nếu một tên cụ thể không tồn tại hoặc không phải là một file .!-d
đánh giá là true nếu một tên cụ thể không tồn tại hoặc không phải là một folder . Luật RewriteRule
trên dòng cuối cùng sẽ chỉ có hiệu lực đối với các yêu cầu đối với các file hoặc folder không tồn tại. Bản thân RewriteRule
rất đơn giản và chuyển hướng mọi yêu cầu đến folder root /
trang web.
mod_rewrite
cho phép bạn tạo các URL mà con người có thể đọc được. Trong hướng dẫn này, bạn đã học cách sử dụng lệnh RewriteRule
để chuyển hướng URL, bao gồm cả những URL có chuỗi truy vấn. Bạn cũng đã học cách chuyển hướng URL có điều kiện bằng chỉ thị RewriteCond
.
Nếu bạn muốn tìm hiểu thêm về mod_rewrite
, hãy xem Giới thiệu về mod_rewrite của Apache và tài liệu chính thức của Apache về mod_rewrite .