Cách nào để tìm ra ngày xuất bản đầu tiên của 1 trang web?

Bạn đang lang thang trên mạng và sực nhìn thấy một trang rất hay ho hoặc đặc biệt. Có thể một bài giới thiệu của người khác viết về mình, 1 kiểu dự đoán tương lai trúng phóc, 1 nội dung quá giống của mình không biết là sao chép hay là sự trùng hợp…Đảo mắt vòng quanh ko thấy published date trên trang bạn đang đọc. Làm thế nào biết được trang web này xuất hiện lúc nào?

Nhóm cách dễ

Hãy tìm ngày xuất bản của trang này: https://magento.com/resources/pos-system-point-of-sale

Bạn có thể sử dụng các cách cơ bản sau đây, được suggest ở bài viết này

1. Look at the comment time stamps

Hãy nhìn vào comment, nếu đó là một bài blog có nhiều comment. Bạn sẽ ước lượng được khoảng thời gian publish của bài viết này.

2. Google the URL

Bạn để chính URL của trang web lên trang Google theo cấu trúc site:URL
Bạn sẽ có kết quả ntn

3. Check source code of the page

Hãy lựa chọn View Page Source, và nhanh chóng Ctrl F để tìm chữ “publish” ở đâu đó quanh trong bài. Bạn sẽ thấy thời gian post bài.

Áp dụng cho bài tập trên, kết quả là:
“datePublished”: “2020-10-11T14:27:10-0700”,
“dateModified”: “2020-10-11T14:27:10-0700”,
“author”: {
@type”: “Organization”,
“name”: “Magento”,
“url”: “https://magento.com”,

4. Check Wayback Machine.

Wayback Machine là cỗ máy khổng lồ, kiểu mắt thần đi dạo vòng quanh và chụp lại hình ảnh website & trang web liên tục. Khi paste 1 URL lên wayback machine, bạn cũng sẽ thấy được ngày đầu tiên mà cỗ máy tìm ra trang web của bạn.

Tuy nhiên áp dụng cách này cho bài trên thì ko ra dữ liệu,

Nhóm cách khó

Hãy tìm ngày published date của trang https://www.vendhq.com/web-pos-software

Sử dụng 3 cách đầu tiên để tìm kiếm URL này: https://www.vendhq.com/web-pos-software, bạn sẽ không thấy published date. Một lí do đơn giản, bài viết ở nhóm cách dễ đang lấy ví dụ 1 bài blog của Magento, theo dạng blog thường sẽ dễ tìm kiếm ngày hơn. Còn khi là 1 landing page theo kiểu selling page như trên, tìm ngày xuất bản sẽ khó hơn.

Nếu sử dụng Wayback Machine bạn sẽ thấy thời gian trỏ về năm 2016, tầm tháng 1. Liệu đây đã là kết quả chính xác?

Hãy cùng thử 1 cách advanced hơn nhé.

  1. Copy the website’s URL and paste it in Google’s search box.
    Paste đúng URL vào search box nhưng đừng hit enter vội. Nhớ là full address của URL đấy nhé, có cả https:// các kiểu.

  2. Type “inurl:” in front of the page URL and hit search.**
    Và khi đó, phần address bar của thanh search sẽ có structure như thế này: https://www.google.com/search?q=inurl:https://www.example.com

  1. Add “&as_qdr=y15” after the URL, then search again
    Thêm cụm &as_qdr=y15 vào phần address bar của Google search, và ấn enter. Bạn sẽ có kết quả.

Ví dụ sau khi làm 3 bước, address của mình là: https://www.google.com/search?q=inurl:https://www.vendhq.com/web-pos-software&as_qdr=y15

Và mình có được kết quả như sau:

Ồ, hoá ra first publish date là tận năm 2014, chứ ko phải 2016 như Wayback Machine đã chỉ.

Hậu tố as_qdr=y15 là một chỉ số guide Google sẽ tìm kiếm dựa trên ngày và kéo lại các dữ liệu đã được google index trong vòng 15 năm qua. Bạn có thay con số 15 bằng 20,25 cũng được.

Mọi người có thể cùng thử nhé! Have fun.

Jasmine.

1 Like

cách advance đã thử và thành công :100:

1 Like

Ồ ko biết là em cũng khoái món này, em tìm của trang web nào đó?

Thank you chị! Ngồi check tuổi đời trang web cũng vui ạ