[Mã code 49342]

Full code crawl dữ liệu môn Kỹ thuật lập trình trong phân tích dữ liệu (kèm tiểu luận báo cáo)

  (1 Đánh giá)
  0       226    

Code tự động crawl dữ liệu từ web xem phim về các thông tin như sau: tên phim, ảnh bìa, diễn viên, đạo diễn, lời lượng, nội dung. Sau đó up lên web với chức năng đơn giản là tìm kiếm với tên, dv, đd..

Danh mục
Thể loại
Ngày đăng
21-5-2024
Loại file
Full code
File download
 TopCode_Crawl web xem phim-20240528T153645Z-001.zip [3.07 MB]
CAM KẾT TỪ NGƯỜI BÁN
Chức năng đầy đủ và giống demo 100%
Hỗ trợ cái đặt qua teamview
Code có đầy đủ chức năng báo cáo, thống kê


Source code
4

Đánh giá (3)
5/5

Ngày tham gia
31/5/2022

Project có 3 trang web như sau:

  1. Index: Giới thiệu về tên project, tên nhóm báo cáo.
  2. Danh mục: Bảng danh sách các trang web xem phim đã crawl.
  3. Phim: Có ô tìm kiếm cho nhập các từ khóa đa dạng như: tên phim, thể loại, diễn viên, đạo diễn, nội dung phim. Dưới tìm kiếm là bảng danh sách các phim đã được crawl về. Mỗi trang có 20 phim và sẽ được phân trang liên tục như thế. Nội dung phim được tùy chỉnh với số chữ tùy ý (có xem thêm để xem hết nội dung và rút gọn về trạng thái ban đầu).

Lưu ý: Quá trình crawl diễn ra hơi lâu nên vui lòng kiên nhẫn chờ đợi!

 


XEM THÊM ==> Hướng dẫn cài đặt chi tiết

HÌNH ẢNH DEMO


crawl,Full code báo cáo,code web phân tích,code,code lập trình mạng,phân cụm dữ liệu

crawl,Full code báo cáo,code web phân tích,code,code lập trình mạng,phân cụm dữ liệu

crawl,Full code báo cáo,code web phân tích,code,code lập trình mạng,phân cụm dữ liệu


HƯỚNG DẪN CÀI ĐẶT

Yêu cầu cài đặt trước:

  1. Pycharm.
  2. Python.
  3. SQLiteStudio.

Sau khi tải về:

  1. Giải nén source.
  2. Copy hoặc cut file đã được giải nén vào project bất kỳ.
  3. Mở file utils.py.
  4. Mở terminal cài đặt các thư viện như sau: newpaper3k, flask, sqlite3, lxml[html_clean]
  5. Chạy file utils.py và chờ crawl vào db. Kiểm tra db đã crawl được trong file db.db ở bảng Phim. Dừng crawl nếu thấy đã đủ yêu cầu của project hoặc sửa số dòng crawl trong code lại tùy theo yêu cầu ở vòng lại while trong hàm get_Phim_url() để crawl tự động dừng.
  6. Sửa code file ThongTin.html lại cho phù hợp với project của bạn.
  7. Chạy file render_templates.py.
  8. Chạy file api.py và xem kết quả

Ib qua zalo 0375030925 để hỗ trợ nếu không chạy code được. Tất cả đều không tính phí!




Nguồn: Topcode.vn

BÌNH LUẬN (2)


Senpai Sara Trả lời Thích  023:10 - 23/5/2024
Tin juan k
Võ Quốc Thái Trả lời Thích  021:31 - 5/6/2024
@Senpai Sara Chuẩn nha

ĐÁNH GIÁ (1)

ĐIỂM TRUNG BÌNH

5
1 Đánh giá
Code rất tốt (1)
Code tốt (0)
Code rất hay (0)
Code hay (0)
Bình thường (0)
Thành viên
Nội dung đánh giá
16:17 - 21/5/2024
Code rất tốt
Code rất tốt và phù hợp để phát triển
HỖ TRỢ TRỰC TUYẾN