Chắc hẳn trong quá trình làm việc với máy tính, chúng ta sẽ có thể bắt gặp những file có đuôi là .xml. Những file này cần phải có phần mềm chuyên biệt để xử lý thì mới có thể mở lên sử dụng được. Vậy khái niệm của XML là gì? Liệu dạng flie XML sẽ được sử dụng trong những trường hợp như thế nào? Hãy cùng Teky tìm hiểu ngay trong bài viết sau nhé!
Khái niệm XML là gì?
Cùng giống như JSON, XML là một ngôn ngữ đánh dấu. XML được viết tắt từ tên eXtensible Markup Language, có nghĩa là ngôn ngữ đánh dấu mở rộng. Ngôn ngữ này được World Wide Web Consortium (W3C) kiến nghị tạo nên để góp phần xây dựng các API Service. XML có khả năng truyền dữ liệu và đọc dịch nhiều loại dữ liệu khác nhau. API sẽ trả kết quả về dạng XML để các hệ thống khác nhau có thể nói chuyện với nhau được.
Nếu mô tả một cách đơn giản hơn thì XML giống như một máy phiên dịch ngôn ngữ giữa các hệ thống với nhau vậy. Ngoài chức năng thông dịch, nó còn giúp đơn giản hóa dữ liệu giữa các platform và hệ thống khác nhau. XML cũng có thể được dùng như một kho lưu trữ các dữ liệu đã trao đổi.
Ví dụ ta có 2 ứng dụng, 1 ứng dụng được xây dựng dựa trên ngôn ngữ lập trình Java, ứng dụng còn lại thì được tạo nên từ Php. Vậy thì hai ứng dụng này hoàn toàn không thể kết nối với nhau được. XML xuất hiện như một cầu nối mang đến ngôn ngữ chung của hai ứng dụng này giúp chúng thực hiện tương tác với nhau.
Cấu trúc và thành phần của file XML
Cấu trúc XML được dựa trên các NODE lồng vào nhau. Mỗi NODE có đủ 1 thẻ đóng và 1 thẻ mở. Minh họa như sau:
<NodeName>Nội dung</NodeName>
Một cách ứng dụng nữa là thêm thuộc tính cho thẻ như sau:
<NodeName> Attribute=””Nội dung</NodeName>
Cấu trúc file XML gồm có 5 thành phần chính:
- Header file:
- Nó được biết đến như thẻ đầu tiên trong file XML. Header file được dùng để thông báo version (thường là 1.0) và còn có tác dụng lưu trữ thông tin về việc mã hóa ký tự. Giá trị encoding của Header file sẽ thuộc một trong những dạng sau: UTF-8, UTF-16, ISO-10646-UCS-2, ISO-10646-UCS-4, ISO-2022-JP. Còn về encoding là gì thì nó là một dạng mã hóa ký tự.
- Ví dụ về thẻ Header file: <?xml version=”1.0″ encoding=”utf-8″ ?>. Vậy utf-8 là gì? UTF-8 ở đây là viết tắt của 8-bit Unicode Transformation Format có nghĩa là định dạng chuyển đổi Unicode 8-bit. Nó được sử dụng như một bộ mã hóa ký tự với chiều rộng biến thiên dành cho Unicode.
- Root node: Là phần tử bên ngoài cùng hay còn được gọi là phần tử gốc. Nó thường là tên gọi hoặc đại diện cho thông tin lưu trữ bên trong XML.
- Element: Cũng là một dạng tên gọi nhưng sẽ dùng để chỉ các tệp con nằm trong Root node.
- Attribute: Là thuộc tính của thẻ, được dùng để phân biệt đặc tính giữa 2 element trùng tên.
- Employee: Mỗi thẻ Employee đại diện cho một nhân viên. Nhiều thẻ Employee sẽ tạo nên một tổ hợp Employees. Trong thẻ Employee còn có những thẻ con để chỉ các thông tin nhỏ lẻ của nhân viên như EmpID, Name, Phone…
Đặc điểm của file XML là gì?
XML được dùng cho những loại dữ liệu có cấu trúc. XML có cấu tạo trực quan khá giống với HTML, nhưng vẫn khác nhau ở nhiều điểm. Có thể nói, XML là cầu nối để đưa HTML đến với XHTML.
Tuy XML tồn tại như một dạng văn bản nhưng nó không dùng để đọc, nó chỉ giúp các hệ thống khác nhau có thể thấu hiểu lẫn nhau. Khi ta nhắc đến định nghĩa đọc file XML trong Java thì có nghĩa là dùng XML để mã hóa Java theo ngôn ngữ đánh dấu, chứ không phải mở văn bản XML ra rồi đọc nó lên.
Vậy định dạng XML là gì? XML có nhiều cách để định dạng khác nhau, dưới đây là một số định dạng phổ biến mà bạn có thể biết:
- RSS và ATOM: Chúng đều dùng để mô tả cách làm thế nào mà ứng dụng đọc xử lý được nguồn cấp web.
- Microsoft .NET: Hệ thống này sẽ sử dụng XML cho các file cấu hình của nó.
- Các phiên bản kể từ Microsoft Office 2007: Chúng sử dụng XML làm cơ sở cho cấu trúc tài liệu. Ký hiệu “X” trong định dạng tài liệu Word .DOCX cũng xuất phát từ đây.
- Ngoài ra, XML cũng được ứng dụng trong Excel (file XLSX) và PowerPoint (file PPTX).
Ưu điểm của file .xml là gì?
Khả năng đọc
Tuy file XML không được dùng để đọc trực tiếp nhưng nó vẫn vô cùng hữu ích đối với các nhà phân tích dữ liệu. Trước mỗi thông tin quan trọng trong XML đều có tag name đầy đủ với ký tự text thân thiện, phù hợp với khả năng đọc hiểu của con người chứ không chỉ là ngôn ngữ máy tính khô khan. Các thông tin được sắp xếp gọn gàng và có tổ chức nên bạn có thể nhanh chóng tra cứu khi cần thiết. Ngoài ra, ngôn ngữ XML tương thích với hầu hết các loại dữ liệu, tạo nên sự trao đổi nhanh chóng giữa máy tính và file cần xử lý.
Tuy nhiên thì người dùng cũng cần biết đến các kiểu mã hóa text trong XML. Nếu bạn còn thắc mắc > là gì hay < là gì thì nó được sử dụng như cách thay thế 2 ký tự > và <.
Khả năng tương thích
Các file XML mang tính độc lập. Điều này có nghĩa là bạn có thể tùy ý di chuyển chúng và sử dụng ở bất cứ vị trí, điều kiện nào. Điều kiện cần thiết để sử dụng XML là phải có phần mềm xử lý. Khi đó bạn có thể lưu trữ và truyền đi dữ liệu của mình.
Khả năng tùy chỉnh
XML là một loại ngôn ngữ đánh dấu mở rộng. Vì thế nó cho phép người dùng thoải mái tạo các tag riêng hoặc sử dụng các tag có sẵn từ người khác. Điều kiện để sử dụng tag của người khác cũng rất đơn giản. Bạn chỉ cần đảm bảo có ngôn ngữ tự nhiên của domain và chúng sở hữu đầy đủ các tính năng cần thiết. Số lượng tag được tạo cũng sẽ không bị giới hạn trong XML.
Nhược điểm của XML
Có một số trường hợp ghi nhận sự sai sót trong quá trình truyền thông tin của XML. Tuy nhiên khả năng xảy ra chỉ khoảng 5-7%, rất thấp. Dù vậy để chắc chắn bạn cũng nên có phương pháp rà soát lại thông tin sau khi tiến hành sử dụng XML nhé.
Những cách ứng dụng phổ biến của XML
XML trở nên phổ biến như vậy là nhờ rất nhiều ứng dụng ưu việt của nó. Để học XML, bạn có thể tham khảo những cách sử dụng web.xml như sau:
Xuất bản web
XML được sử dụng như một công cụ thiết kế web. Các dữ liệu được tạo ra và lưu trữ trong XML. Người dùng có thể sử dụng chúng trên nhiều máy khác nhau. Để chuyển đổi XML thành những bố cục khác, ví dụ như HTML cho các trang web, bạn chỉ cần sử dụng các bộ xử lý chuyển đổi đơn giản. Nhà phát triển web sẽ sử dụng XML như một công cụ hỗ trợ cho hoạt động chỉnh sửa và thao tác nội dung cho các trang web.
Tác vụ web
XML giúp tối ưu hóa khả năng tìm kiếm và tự động hóa các tác động trên web. Nó cho phép người dùng tìm kiếm nhanh chóng một thông tin nào đó với các kết quả rất chuẩn xác. Ví dụ, nếu bạn tìm kiếm cụm từ Black Widow (một loài nhện) qua HTML, kết quả trả về sẽ có cả Black – màu đen và Widow – góa phụ. Nhưng nếu bạn tìm kiếm qua XML, kết quả được thu gọn lại, thông tin cô đọng và chính xác hơn.
Ứng dụng chung
Không chỉ có thể sử dụng cho web, XML phù hợp với cả các phần mềm, hệ thống khác nhau. Nó tạo nên sự liên kết và làm thân thiện hóa phần thông tin cho người dùng. Vì thế XML được các lập trình viên, kỹ sư xây dựng và các kiến trúc sư sử dụng phổ biến hằng ngày.
Mời bạn đọc tham khảo thêm: Danh sách liên kết đơn
Vừa rồi Teky đã mang đến thông tin về chủ đề XML là gì. Nếu bạn muốn tải XML Viewer (hay còn gọi là phần mềm đọc XML) để bắt đầu sử dụng loại file này, hãy tham khảo: TẠI ĐÂY.
The post XML là gì? Tìm hiểu về cấu trúc, đặc điểm của file XML appeared first on TEKY - Học viện sáng tạo công nghệ.
source https://teky.edu.vn/blog/xml-la-gi/
Không có nhận xét nào:
Đăng nhận xét