Khi dùng các chương trình soạn thảo văn bản trên để mở file XML nhập liệu cho Blogspot download từ VietAjax.net/360exp ra thì bạn có thể thấy file đó có cấu trúc như sau:
1. Phần mở đầu:
<?xml version="1.0" encoding="utf-8"?>
<ns0:feed xmlns:ns0="http://www.w3.org/2005/Atom">
<ns0:title type="html">ABC's Blog </ns0:title>
<ns0:generator>Blogger</ns0:generator>
<ns0:link href="http://vietajax.net/360exp" rel="self" type="application/atom+xml" />
<ns0:link href="http://vietajax.net/360exp" rel="alternate" type="text/html" />
<ns0:updated>2009-06-04T05:15:29Z</ns0:updated>
2. Phần nội dung:
Nội dung các entry và các comment
3. Phần kết thúc:
</ns0:feed>
Nội dung mỗi entry hoặc mỗi comment được bao trong cặp thẻ<ns0:entry> và </ns0:entry>
Nội dung của mỗi entry thì sẽ chứa đoạn mã có dạng <ns0:id>post-32</ns0:id> (nội dung của entry thứ 32).
Còn nội dung mỗi comment thì sẽ chứa đoạn mã có dạng <ns0:id>post-32.comment-5</ns0:id> (nội dung comment thứ 5 của entry thứ 32).
Như vậy bạn có thể cắt nhỏ file XML bằng cách cắt nhỏ Phần nội dung, rồi tạo ra các file XML mới có định dạng như sau:
Phần mở đầuChú ý là phần nội dung đã được cắt nhỏ cần chứa nội dung mỗi entry kèm theo nội dung TẤT CẢ các comment của mỗi entry đó.
Phần nội dung đã được cắt nhỏ (chứa khoảng 50 entry)
Phần kết thúc
Không có nhận xét nào:
Đăng nhận xét