Quy trình thu thập dữ liệu của các công cụ social listening

Các nội dung chính

Công cụ social listening là một mô hình kinh doanh biến thể của ngành nghiên cứu thị trường.

Cũng giống như các quy trình nghiên cứu thị trường truyền thống. Công cụ social listening cũng phải trải qua 5 giai đoạn. Bao gồm thu thập dữ liệu, lấy mẫu, phân loại dữ liệu, phân tích dữ liệu, trình bày báo cáo nghiên cứu.

công cụ social listening

Quy trình thu thập dữ liệu của các công cụ social listening

Thu thập dữ liệu là bước đầu tiên trong quá trình thực hiện nghiên cứu trên social media. Các công cụ social listening sẽ phải xây dựng một tổ hợp dữ liệu cho mỗi nước mà mình nghiên cứu (panel). Và việc này có thể mất vài tháng đến nhiều năm. Đồng thời cho mỗi chiến dịch, các agency sẽ yêu cầu bổ sung các kênh được dùng cho chiến dịch đó. Ví dụ như microsite, fanpage mới mà công cụ social listening sẽ phải đáp ứng. Việc thu thập dữ liệu toàn bộ thị trường là cần thiết. Và nó cho phép nhà nghiên cứu cho ra các nghiên cứu về xu hướng và ngành hàng.

Hiện nay có 2 phương pháp chính để thu thập dữ liệu: Từ khóa (Keywords) và Trang (Sites).

Thu thập dữ liệu bằng keywords

Phương pháp này được áp dụng đối với các global social networks như Facebook, Google Plus, Youtube, Twitter , Instagram… Trong đó các công cụ social listening sẽ kết nối với các API (Application Programming Interface – Giao diện lập trình ứng dụng) của các social networks. Và yêu cầu cho phép lấy những dữ liệu có chứa keywords.

Ưu điểm: cho phép lấy dữ liệu của toàn bộ social network, bao gồm các trang cá nhân

Nhược điểm:
Tương tự như công cụ search hashtags của facebook. Việc lấy data bằng API phụ thuộc sự hạn chế của các social networks. API không ổn định và có thể thay đổi dẫn đến việc dữ liệu được trả lại bới API có thể không đầy đủ và không nhất quán theo thời gian. Hiện tại không có một thống kê rõ ràng việc lấy dữ liệu bằng API có thể lấy được bao nhiêu % thảo luận.

công cụ social listening

Quy trình thu thập dữ liệu của các công cụ social listening

Thu thập dữ liệu theo sites

Là việc thu thập dữ liệu theo trang (page) trong đó các trang có dữ liệu muốn thu thập phải được liệt kê trong hệ thống. Phương pháp này giúp thu thập toàn bộ dữ liệu của các kênh được bao phủ. Hệ thống sẽ truy cập vào các website cần thu thập. Click vào các đường link bài viết, đọc bài viết và ghi nhận lại những thông tin có giá trị. Sau đó nghiên cứu một cách hiệu quả mà không làm ảnh hưởng tới các website đang thu thập.

Với phương pháp thu thập dữ liệu bằng sites. Hệ thống thực hiện các thao tác như một người dùng (user) khi truy cập vào trang cần thu thập. Sau khi click vào Thread, hệ thống sẽ sao chép toàn bộ nội dung hiển thị trên màn hình. Bao gồm Title, Replies, Authors, URL,… Sau đó hệ thống sẽ quay lại mỗi trang sớm nhất có thể để tìm ra thread mới và replies mới cho thread cũ.

Mỗi replies sẽ được tính là 1 mention và mỗi thread cũng được tính là 1 mention. Do đó, một thread có 100 replies sẽ được tính là 101 mentions, hay 101 ý kiến người tiêu dùng.

Phương pháp này cũng tồn tại những nhược điểm bên cạnh các ưu điểm

Ưu điểm: Cho phép đảm bảo 100% toàn bộ dữ liệu trong trang

Nhược điểm: Việc lấy dữ liệu theo trang có thể dẫn đến tình trạng thiếu dữ liệu tạm thời vì các lý do sau:

– Cấu trúc site thay đổi

– Site blocking. Việc thu thập dữ liệu tự động nếu lạm dụng tài nguyên của các website sẽ bị chặn bởi admin

– Site down. Không thể truy cập để thu thập dữ liệu khi trang đang bảo trì hoặc xảy ra vấn đề

– Các vấn đề đến từ đường truyền internet

công cụ social listening

Quy trình thu thập dữ liệu của các công cụ social listening

Để xây dựng danh sách tất cả các trang forums, báo điện tử và fanpages ở Việt Nam là một quá trình dài. Vì thế các công cụ social listening nước ngoài thường bị thiếu dữ liệu do việc thu thập danh sách sites không đủ, hoặc khi gặp một trong các vấn đề trên thì không có nhân sự để giải quyết ngay tức thì.

Công nghệ của công cụ social listening cũng như công nghệ search engine, đó là mô hình tổng hợp dữ liệu thị trường. Một công cụ social listening phải lưu trữ dữ liệu tối thiểu 2 năm để phục vụ các mục đích nghiên cứu. Áp lực lưu trữ và xử lý dữ liệu cũng tăng theo thời gian vì thế khoản đầu tư vào hệ thống cơ sở hạ tầng phần cứng cũng là rất lớn và liên tục.

Adsplus.vn

Cảm ơn bạn đã xem bài viết này. Hãy cập nhật thêm các bài viết từ Adsplus để biết thêm những thông tin mới nhất về Marketing. Và các Tips chạy quảng cáo hiệu quả.

  • Tham khảo các khóa học Google Ads, Facebook Ads tại guru.edu.vn
  • Tham khảo các gói set up tài khoản quảng cáo Google Ads, Facebook Ads tại 1ad.vn

BÌNH LUẬN

Please enter your name here
Please enter your comment!

Gọi 1800.0098 ( miễn phí ) để tư vấn tốt nhất,
ĐĂNG KÝ DỊCH VỤ

ĐĂNG KÝ DỊCH VỤ