URL là viết tắt của Uniform Resource Locator (Định vị tài nguyên thống nhất), dùng để thay thế cho các địa chỉ IP, giúp máy tính có thể giao tiếp với máy chủ và hệ thống máy chủ, xác định cấu trúc và vị trí của tệp trên từng website nhất định và được dùng để mở không chỉ các trang web, mà còn để tải hình ảnh, video, chương trình, phần mềm, ứng dụng và các loại tệp khác được lưu trữ trên máy chủ. Ngoài ra, trong từ ngữ kỹ thuật chuyên ngành, URL là một dạng của URI hoặc trong các tài liệu khác URL được xem là một từ đồng nghĩa khác của URI.
Muốn mở một tệp trên máy tính của bạn đơn giản chỉ bằng cách nhấp đúp chuột vào nó, nhưng để mở các tệp trên máy tính từ xa, như các máy chủ web, chúng ta phải sử dụng các URL để trình duyệt biết được nơi để xem.

Nguồn gốc của URL

Uniform Resource Locator được chuẩn hóa vào năm 1993, bởi Tim Berners Lee và các nhóm làm việc về URI của Internet Engineering Task Force, dựa trên những nghiên cứu trước đó của nhóm này khi biên soạn ra tài liệu “Birds of a Feather” trước đó vào năm 1992.

Cấu trúc của URL

Một URL có thể được chia thành các phần khác nhau, mỗi phần đảm nhiệm một mục đích cụ thể khi truy cập vào một tệp tin từ xa.

Các URL của HTTP và FTP được cấu trúc giống nhau, chẳng hạn như protocol://hostname/fileinfo. Ví dụ: truy cập tệp FTP có URL của nó có thể giống như sau:

FTP://servername/folder/file.html

Hoặc:

https://new.example.com/folders/file.html
  • HTTP(S) là giao thức (như FTP) xác định loại máy chủ mà bạn đang kết nối.
  • example là tên miền.
  • new là tên máy chủ được sử dụng để truy cập trang web này.
  • com là tên miền được gọi là top-level domain (TDL), một số tên miền khác bao gồm .net, .org, .vn, gov.vn, v.v …
  • folders đại diện cho các thư mục được sử dụng để phân bố các trang web hoặc tập tin. Trên máy chủ web đang lưu giữ các tệp của trang web, đây sẽ là các thư mục chủ dùng để tìm tệp tin mà URL này đang chỉ định.
  • file.html là tệp mà URL đang trỏ đến. Nếu bạn đang cố gắng tải hình ảnh, tệp âm thanh hoặc loại tệp khác thay vì tệp HTML, thì URL sẽ kết thúc ở phần mở rộng của tệp đó (*.JPG, *.PNG,*.MP3,…).

Nguyên tắc trong cú pháp URL

Chỉ cho phép số, chữ cái và các ký tự sau trong URL: ()!$-‘_*+.

Các ký tự khác phải được mã hóa (dịch sang mã lập trình) để được sử dụng trong một URL.

Một số URL có các tham số, dùng chia URL ra khỏi các biến bổ sung. Ví dụ: khi bạn thực hiện tìm kiếm trên trang:

https://hatory.com/blog/?s=search

Dấu chấm hỏi mà bạn thấy dùng để gửi một lệnh tìm kiếm tới máy chủ website để có được kết quả tùy chỉnh.

Mã lệnh trên được sử dụng để thực hiện các chức năng tìm kiếm, vì vậy bất kỳ từ khóa gì theo sau ?s= của một URL phải được xác định là thuật ngữ tìm kiếm.

Một từ khóa khác trong URL:

https://hatory.com/blog/?s=search+for+new+feed

Mặc dù khoảng trắng trong URL không được chấp nhận, một số trang web sử dụng ký hiệu + mà bạn có thể thấy trong  ví dụ trên. Một số trang sử dụng kí tự khác thay cho khoảng trắng, cụ thể là Google sử dụng kí tự %20

Một URL có thể sử dụng nhiều biến với một hoặc nhiều ký hiệu sau dấu chấm hỏi:

https://hatory.com/blog/?s=search+for+new+feed&sort=newest

Biến đầu tiên, URL, được đặt trước bởi dấu chấm hỏi, nhưng biến tiếp theo sort, được thêm vào trước bởi một dấu &.

Các phần của URL có phân biệt chữ hoa và chữ thường – cụ thể là mọi kí tự sau tên miền (thư mục và tên tệp). Bạn có thể thấy https://hatory.com/blog khác với https://hatory.com/Blog → khi truy cập vào trang sẽ trả về lỗi 404 Page Not Found.

Một số thông tin khác về URL

Nếu một URL điều hướng bạn đến một tệp tin mà trình duyệt web hỗ trợ hiển thị ngay trên trình duyệt, giống như một định dạng hình ảnh JPG, thì bạn thực sự không cần phải tải tập tin xuống máy tính của bạn để xem nó. Tuy nhiên, đối với các tệp mà trình duyệt không hỗ trợ, chẳng hạn như các tệp PDF, ZIP, EXE,… bạn sẽ được lựa chọn tải hay không tải tệp xuống máy tính.

Một số URL thực sự quá dài và phức tạp thì được sử dụng tốt nhất nếu bạn nhấp chuột vào nó dưới dạng liên kết hoặc sao chép  dán vào thanh địa chỉ của trình duyệt. Lỗi sai URL có thể tạo ra mã trạng thái HTTP 404 Page Not Found

Hầu hết các URL không yêu cầu phải cung cấp tên cổng. Ví dụ: truy cập google.com có thể được thực hiện bằng cách chỉ định số cổng đó ở cuối như https://www.google.com:80 nhưng không cần thiết. Nếu trang web đang hoạt động trên cổng 8080, bạn có thể thay thế cổng và truy cập trang theo cổng đó.

Theo mặc định, các trang FTP sử dụng cổng 21, nhưng các trang khác có thể được thiết lập trên cổng 22. Nếu trang FTP không sử dụng cổng 21, bạn phải chỉ định cổng nào đang sử dụng để truy cập vào máy chủ một cách chính xác.

BÌNH LUẬN

Please enter your comment!
Please enter your name here