Rip trang web bằng máy sao chép trang web HTTrack

Hãy Thử Công Cụ CủA Chúng Tôi Để LoạI Bỏ Các VấN Đề

HTTRack là một porgram miễn phí dành cho Windows và các hệ điều hành Unix khác nhau mà bạn có thể sử dụng để sao chép nội dung của một trang web vào hệ thống cục bộ của mình. Nó cho phép bạn tải tất cả các trang và thông tin của một trang web vào hệ thống cục bộ. Đây thường được gọi là trang web sao chép. Mặc dù đó là sức mạnh lớn nhất của nó, nhưng bạn cũng có thể sử dụng nó để nhanh chóng tải xuống chỉ một trang của trang web hoặc một danh mục.

Đây là một chương trình dành cho người dùng có kinh nghiệm và những người không ngại dành thời gian khám phá tất cả các tùy chọn mà nó cung cấp. Nó cung cấp nhiều tùy chọn cấu hình thoạt nhìn có vẻ đáng sợ, nhưng nếu bạn vượt qua được giai đoạn đầu đó, bạn chắc chắn sẽ đánh giá cao những gì nó mang lại. Hầu hết các cài đặt là tùy chọn và giúp bạn xử lý các trang web trường hợp đặc biệt sử dụng nhiều tập lệnh, các trang được tạo động hoặc yêu cầu xác thực.
Một câu hỏi có thể xuất hiện là tại sao bạn muốn tách một trang web sang hệ thống cục bộ của mình? Có nhiều lý do cho việc này. Có thể bạn muốn cung cấp nội dung của trang web để duyệt ngoại tuyến. Điều này có thể hữu ích nếu PC bạn cần thông tin không có kết nối Internet hoặc ít nhất là không có kết nối cố định. Nó cũng có thể hữu ích nếu bạn biết hoặc lo sợ rằng một trang web có thể bị chuyển sang chế độ ngoại tuyến trong tương lai gần. Chương trình có thể giúp bạn lưu giữ thông tin bằng cách tải tất cả chúng xuống hệ thống của bạn. Bạn có thể dùng nó để tạo bản sao lưu cục bộ cho trang web của mình, mặc dù thường có các tùy chọn khác về vấn đề này. Lưu trang web vào máy tính cục bộ

httrack

  1. Sau khi bạn đã cài đặt ứng dụng, hãy chạy nó và nhấp vào tiếp theo trên màn hình đầu tiên.
  2. Đặt tên cho dự án của bạn và chỉ định một danh mục cho nó (tùy chọn). Tôi khuyên bạn nên sử dụng tên của trang web ở đây.
  3. Đường dẫn cơ sở là vị trí nơi trang web sẽ được lưu trữ. Đảm bảo rằng bạn có đủ không gian web trên ổ đĩa. Nhấp vào tiếp theo sau đó.
  4. Bây giờ bạn có thể nhập một hoặc nhiều địa chỉ web vào một biểu mẫu mà bạn muốn xử lý. Ngoài ra, bạn có thể tải một tệp văn bản chứa danh sách các url vào chương trình.
  5. Hành động xác định những gì bạn muốn chương trình thực hiện với các url. Hành động mặc định là tải trang web xuống, nhưng bạn có thể thay đổi nó để cập nhật bản tải xuống hiện có, liên kết thử nghiệm trên trang web và nhiều loại khác. Thông thường, (các) trang web tải xuống là lựa chọn phù hợp tại đây.
  6. Nhấp vào đặt tùy chọn để xác định tùy chọn. Đây là điều quan trọng và không nên bỏ qua.
  7. Các tab ưu tiên quan trọng là các giới hạn mà bạn sử dụng để xác định độ sâu phản chiếu tối đa (dựa trên các liên kết mà chương trình sẽ tuân theo) và quét các quy tắc mà bạn có thể sử dụng để bao gồm hoặc loại trừ các liên kết hoặc loại dữ liệu đã chọn.
  8. Tôi khuyên bạn cũng nên xem qua các tab khác ở đây để hiểu cơ bản về chức năng của chương trình. Hầu hết có thể được giữ ở mức mặc định của chúng.
  9. Bạn có thể điều chỉnh các thông số kết nối trên trang tiếp theo. Ví dụ ở đây bạn có thể chọn tắt PC khi hoàn tất hoặc ngắt kết nối Internet.

Trang web HTTrack cung cấp một hướng dẫn từng bước một mà bạn có thể sử dụng để tìm hiểu về chương trình và cốt lõi của các tính năng của nó. Điều này đủ để tách trang web đầu tiên của bạn. HTTrack có sẵn cho Windows và Unix, Linux & BSD.

Cách tốt nhất để bắt đầu với HTTrack là xem thủ công đăng trên trang web hướng dẫn bạn sao chép trang web đầu tiên của bạn với sự trợ giúp của chương trình. Bạn cũng có thể xem các hướng dẫn của chúng tôi về chủ đề này, ví dụ: cách lưu trang web vào ổ cứng của bạn hoặc cách tách hầu hết các trang web.

Lời khuyên

  1. Chương trình tạo một tệp nhật ký bất cứ khi nào nó chạy một hoạt động. Sử dụng nó để tìm lỗi và các vấn đề và điều chỉnh dự án cho phù hợp.
  2. Bạn có thể tải xuống phiên bản 32 bit hoặc 64 bit cho Windows từ trang web của nhà phát triển. Chương trình cũng đang được cung cấp dưới dạng phiên bản di động. Đảm bảo rằng bạn chạy WinHTTrack.
  3. Chương trình hỗ trợ giao thức https (SSL).
  4. Tùy chọn 'nhận tệp gần liên kết' cho phép bạn tải xuống tệp được lưu trữ trên các trang web của bên thứ ba mà không cần định cấu hình chương trình để thu thập dữ liệu các trang web của bên thứ ba đó.