Cùng với đóng góp về lý thuyết, nghiên cứu đề xuất việc ứng dụng cho các doanh nghiệp thương mại điện tử trong việc cải thiện quản trị khách hàng và tối ưu hóa truyền thông tiếp thị.
Lê Đình Thái
Email: ld.thai@hutech.edu.vn
Lưu Thanh Tâm
Email: lttam@hutech.edu.vn
Khoa Quản trị kinh doanh, Đại học Công nghệ Thành phố Hồ Chí Minh (HUTECH)
Tóm tắt
Nghiên cứu này tập trung phân tích cảm xúc của người tiêu dùng từ các đánh giá sản phẩm trực tuyến và ảnh hưởng của chúng đến hành vi tiêu dùng trên 3 nền tảng thương mại điện tử lớn: Shopee, Lazada và Amazon. Dựa trên hơn 1,5 triệu phản hồi khách hàng thu thập từ năm 2021 đến 2024, nghiên cứu sử dụng mô hình học sâu (BiLSTM, BERT) để trích xuất cảm xúc từ ngôn ngữ tự nhiên. Kết quả cho thấy, các đánh giá mang tính cảm xúc tích cực có xác suất cao hơn đáng kể trong việc đạt đánh giá 5 sao và có liên hệ mạnh với hành vi mua lại trong vòng 30 ngày; cảm xúc tiêu cực đặc biệt liên quan đến các yếu tố như thời gian giao hàng, chất lượng đóng gói và thái độ phục vụ khách hàng, có tác động tiêu cực đến lòng trung thành. Cùng với đóng góp về lý thuyết, nghiên cứu đề xuất việc ứng dụng cho các doanh nghiệp thương mại điện tử trong việc cải thiện quản trị khách hàng và tối ưu hóa truyền thông tiếp thị.
Từ khóa: Phân tích cảm xúc, hành vi tiêu dùng, thương mại điện tử, Shopee, Lazada, Amazon
Summary
This study focuses on analyzing consumer sentiment from online product reviews and their influence on consumer behavior across three major e-commerce platforms: Shopee, Lazada, and Amazon. Based on more than 1.5 million customer reviews collected between 2021 and 2024, the research employs deep learning models (BiLSTM, BERT) to extract sentiment from natural language. The results reveal that positive emotional reviews are significantly more likely to be associated with 5-star ratings and show a strong correlation with repurchase behavior within 30 days. Negative sentiments, particularly related to delivery time, packaging quality, and customer service attitude, are linked to reduced customer loyalty. Beyond its theoretical contribution, the study offers practical applications for e-commerce businesses in improving customer relationship management and optimizing marketing communication strategies.
Keywords: Sentiment analysis, consumer behavior, e-commerce, Shopee, Lazada, Amazon
GIỚI THIỆU
Trong nghiên cứu marketing truyền thống, việc đo lường hành vi tiêu dùng thường dựa trên khảo sát định lượng hoặc theo dõi hành vi mua bán. Tuy nhiên, trong môi trường thương mại điện tử (TMĐT) hiện đại, phản hồi ngôn ngữ của người tiêu dùng trên các nền tảng như Shopee, Lazada và Amazon là những tài nguyên chưa được khai thác đầy đủ về mặt kinh tế học hành vi. Những phản hồi này, nếu được phân tích đúng cách, có thể cung cấp thông tin có giá trị không chỉ về mức độ hài lòng mà còn về xu hướng tiêu dùng, rủi ro rời bỏ thương hiệu và cơ hội cải thiện sản phẩm.
Phân tích cảm xúc (Sentiment Analysis) đã trở thành một lĩnh vực then chốt trong xử lý ngôn ngữ tự nhiên (Natural Language Processing – NLP), đặc biệt với sự ra đời của các mô hình học sâu như Long Short-Term Memory (LSTM), Bidirectional LSTM (BiLSTM) và Bidirectional Encoder Representations from Transformers (BERT). Trong khi các nghiên cứu kỹ thuật tập trung vào việc tối ưu độ chính xác của mô hình, rất ít nghiên cứu tích hợp kết quả phân tích cảm xúc vào khung phân tích hành vi tiêu dùng và tác động kinh tế thực tế.
Nghiên cứu này nhằm giải quyết khoảng trống đó thông qua việc thu thập và xử lý tập dữ liệu lớn từ 3 nền tảng TMĐT phổ biến tại Việt Nam và quốc tế; trích xuất cảm xúc bằng mô hình học sâu hiện đại, đánh giá độ chính xác và khả năng phân biệt các mức độ cảm xúc; phân tích mối quan hệ giữa nhãn cảm xúc và các hành vi kinh tế cụ thể như đánh giá sao và hành vi mua lại; đề xuất các ứng dụng thực tiễn trong quản trị trải nghiệm khách hàng, chính sách giá và chiến lược marketing dựa trên phân tích cảm xúc.
TỔNG QUAN TÀI LIỆU
Phản hồi người tiêu dùng và hành vi kinh tế
Theo Oliver (1997), sự hài lòng tiêu dùng có ảnh hưởng trực tiếp đến lòng trung thành và hành vi tái mua. Trong môi trường trực tuyến, điều này được phản ánh rõ nét qua các đánh giá và bình luận sản phẩm. Nhiều nghiên cứu đã chỉ ra rằng phản hồi tích cực không chỉ nâng cao xác suất mua lại mà còn cải thiện khả năng sản phẩm được gợi ý bởi thuật toán đề xuất (Archak et al., 2011). Trên Amazon, các sản phẩm có đánh giá tích cực và chứa ngôn ngữ cảm xúc mạnh như “excellent”, “worth it” thường có tỷ lệ chuyển đổi cao hơn 15% so với nhóm trung tính.
Tại Đông Nam Á, phản hồi trên Shopee và Lazada thường bao gồm các yếu tố trải nghiệm ngoài sản phẩm như đóng gói, giao hàng, và dịch vụ khách hàng. Theo dữ liệu từ Cổng thông tin TMĐT iPrice năm 2022, hơn 30% bình luận tiêu cực trên Shopee liên quan đến dịch vụ hậu cần, cho thấy cảm xúc không chỉ gắn với sản phẩm mà còn với trải nghiệm toàn diện.
Phân tích cảm xúc trong kinh tế hành vi
Phân tích cảm xúc (Sentiment Analysis) là nhánh nghiên cứu sử dụng kỹ thuật xử lý ngôn ngữ tự nhiên để trích xuất và phân loại cảm xúc từ văn bản. Phát triển từ lĩnh vực khoa học máy tính (Pang & Lee, 2008; Liu, 2012), phương pháp này đã được áp dụng rộng rãi trong kinh doanh, tài chính và gần đây là trong nghiên cứu hành vi tiêu dùng.
Trong kinh tế học hành vi, cảm xúc đóng vai trò như một thành tố ảnh hưởng đến nhận thức và ra quyết định. Khi người tiêu dùng viết đánh giá, họ không chỉ truyền tải thông tin mà còn thể hiện cảm xúc gắn với trải nghiệm. Điều này cho phép các nhà nghiên cứu suy luận trạng thái thái độ và dự đoán xu hướng tiêu dùng mà không cần khảo sát truyền thống.
Mô hình học sâu và hiệu quả phân tích cảm xúc
Trong 10 năm qua, sự phát triển của mô hình học sâu (deep learning) đã nâng cao đáng kể độ chính xác của phân tích cảm xúc. Các mô hình như CNN, LSTM, BiLSTM và gần đây là BERT đã chứng minh hiệu quả vượt trội trong việc trích xuất ngữ nghĩa ngữ cảnh. Mô hình BERT đạt độ chính xác 91-94% trên tập dữ liệu đánh giá sản phẩm Amazon khi phân loại cảm xúc 3 mức độ (tích cực, tiêu cực, trung tính).
Tuy nhiên, phần lớn các nghiên cứu vẫn tập trung vào nền tảng Amazon và ngôn ngữ tiếng Anh, trong khi các thị trường mới nổi như Đông Nam Á với đa dạng ngôn ngữ và hành vi tiêu dùng đặc thù vẫn chưa được nghiên cứu đầy đủ. Một số nghiên cứu gần đây tại Việt Nam (Nguyen et al., 2022) cho thấy mô hình BERT đa ngôn ngữ vẫn đạt được hiệu quả tốt khi áp dụng cho dữ liệu Shopee và Lazada bằng tiếng Việt, song cần hiệu chỉnh tùy ngữ cảnh.
PHƯƠNG PHÁP NGHIÊN CỨU
Khung phương pháp
Nghiên cứu này áp dụng phương pháp định lượng để phân tích mối liên hệ giữa cảm xúc ngôn ngữ trong đánh giá sản phẩm và các hành vi tiêu dùng cụ thể như đánh giá sao và hành vi mua lại. Phân tích được thực hiện trên dữ liệu đánh giá văn bản thu thập từ 3 nền tảng TMĐT: Shopee, Lazada và Amazon. Khung nghiên cứu kết hợp kỹ thuật xử lý ngôn ngữ tự nhiên (NLP), mô hình học sâu để trích xuất cảm xúc và các phương pháp phân tích thống kê kinh tế học như hồi quy logistic, kiểm định chi bình phương và tương quan Pearson.
Quy trình nghiên cứu gồm 4 giai đoạn chính: thu thập dữ liệu; tiền xử lý và gán nhãn cảm xúc; mã hóa và tổ chức dữ liệu; phân tích định lượng.
Mô hình phân tích
Nghiên cứu sử dụng mô hình hồi quy logistic nhị phân để đánh giá xác suất xảy ra hành vi tiêu dùng mong muốn (chẳng hạn như hành vi mua lại), dựa trên cảm xúc biểu hiện trong đánh giá văn bản.
Biến phụ thuộc chính:
Repurchase_
i: biến nhị phân (1 nếu người tiêu dùng mua lại trong vòng 30 ngày, 0 nếu không)
Biến độc lập:
-
EmotionScore_
i: giá trị cảm xúc được trích xuất từ văn bản đánh giá (mã hóa 1 = tiêu cực, 2 = trung tính, 3 = tích cực)
-
StarRating_
i: số sao đánh giá (1-5)
-
Length_
i: độ dài bình luận (số từ)
-
Platform_
i: biến giả cho nền tảng (Shopee, Lazada, Amazon)
Mô hình hồi quy có dạng:
logt (P(Repurchasei = 1)) = β0 + β1EmotionScorei + β2StarRatingi + β3Lengthi + β4Platformi + ϵi
Ngoài ra, một mô hình hồi quy tuyến tính được sử dụng để kiểm định ảnh hưởng của cảm xúc đến số sao đánh giá (StarRating_
i) với các biến tương tự.
Dữ liệu và tiền xử lý
Dữ liệu nghiên cứu được thu thập từ 3 nền tảng TMĐT phổ biến gồm: Shopee, Lazada, Amazon. Tổng cộng 1.523.034 đánh giá sản phẩm được thu thập trong khoảng thời gian từ tháng 1/2021 đến tháng 3/2024, phân bố như tại Bảng 1.
Bảng 1: Phân bố dữ liệu nghiên cứu
Nền tảng
|
Số đánh giá
|
Ngôn ngữ chính
|
Tỉ lệ có phản hồi văn bản (%)
|
Shopee
|
503,000
|
Tiếng Việt
|
92.4%
|
Lazada
|
512,114
|
Việt, Anh
|
88.6%
|
Amazon
|
507,920
|
Tiếng Anh
|
100%
|
Nguồn: Thống kê của các tác giả
Tất cả dữ liệu đều được xử lý ẩn danh, không thu thập thông tin cá nhân, đảm bảo tuân thủ các quy định về bảo mật dữ liệu theo Nghị định số 13/2023/NĐ-CP của Chính phủ.
Các biến định lượng được mã hóa từ dữ liệu thu thập như Bảng 2.
Bảng 2: Các biến định lượng được mã hóa từ dữ liệu thu thập
Tên biến
|
Loại biến
|
Mô tả
|
ReviewText
|
Văn bản
|
Nội dung đánh giá của người dùng
|
StarRating
|
Rời rạc (1-5)
|
Số sao sản phẩm được đánh giá
|
EmotionLabel
|
Danh mục
|
Nhãn cảm xúc (0 = tiêu cực, 1 = trung tính, 2 = tích cực)
|
Length
|
Số liên tục
|
Số lượng từ trong đánh giá
|
Repurchase
|
Nhị phân
|
Biến giả (1 = người dùng mua lại sản phẩm trong vòng 30 ngày, 0 = không)
|
LikeCount
|
Số nguyên
|
Số lượt thích của đánh giá từ cộng đồng người dùng (nếu có)
|
Platform
|
Biến giả
|
1 = Shopee, 2 = Lazada, 3 = Amazon
|
Nguồn: Đề xuất của các tác giả
KẾT QUẢ VÀ PHÂN TÍCH
Phân tích mối liên hệ giữa cảm xúc và hành vi tiêu dùng
Sau khi gán nhãn cảm xúc cho hơn 1,3 triệu đánh giá bằng mô hình BERT, nghiên cứu thực hiện các phân tích định lượng nhằm kiểm định 2 giả thuyết chính:
H1: Cảm xúc tích cực trong đánh giá có tương quan dương với số sao đánh giá (StarRating).
H2: Cảm xúc tích cực có ảnh hưởng tích cực đến xác suất người dùng mua lại (Repurchase).
Kết quả hồi quy tuyến tính: cảm xúc → số sao
Mô hình hồi quy tuyến tính được sử dụng để phân tích mối quan hệ giữa nhãn cảm xúc (EmotionLabel: 0-2) và điểm số sao (StarRating: 1-5), kiểm soát theo nền tảng và độ dài đánh giá:
StarRatingi = β0 + β1Emotioni + β2Lengthi + β3Platformi + ϵi
Bảng 3: Kết quả hồi quy tuyến tính
Biến độc lập
|
Hệ số (β)
|
Sai số chuẩn
|
p-value
|
---|---|---|---|
Emotion (0-2)
|
0.837
|
0.012
|
<0.001
|
Length (log)
|
0.214
|
0.006
|
<0.001
|
Platform: Lazada
|
-0.172
|
0.018
|
<0.001
|
Platform: Amazon
|
0.246
|
0.021
|
<0.001
|
Hằng số
|
2.934
|
0.043
|
<0.001
|
R²
|
0.460
|
Nguồn: Tính toán của các tác giả
Kết quả tại Bảng 3 cho thấy, khi cảm xúc tăng một mức (từ tiêu cực → trung tính hoặc trung tính → tích cực), số sao trung bình tăng 0.837 điểm. Các bình luận dài hơn cũng có xu hướng đánh giá cao hơn. Amazon có xu hướng cho điểm cao hơn Shopee và Lazada (hiệu ứng nền tảng).
Kết quả hồi quy logistic: cảm xúc → hành vi mua lại
Tiếp theo, mô hình hồi quy logistic nhị phân được áp dụng để dự đoán khả năng người dùng quay lại mua cùng sản phẩm trong vòng 30 ngày (Repurchase = 1).
logit (P(Repurchase=1)) = α0 + α1Emotion + α2StarRating + α3Platform + ηi
Bảng 4: Kết quả hồi quy logistic
Biến độc lập
|
Hệ số logit
|
Tỷ lệ odds (OR)
|
p-value
|
---|---|---|---|
Emotion
|
0.912
|
2.49
|
<0.001
|
StarRating
|
0.624
|
1.87
|
<0.001
|
Platform: Lazada
|
-0.288
|
0.75
|
<0.010
|
Platform: Amazon
|
0.134
|
1.14
|
<0.050
|
Hằng số
|
-3.018
|
<0.001
| |
Pseudo R²
|
0.370
|
Nguồn: Tính toán của các tác giả
Kết quả Bảng 4 cho thấy, mỗi mức tăng trong cảm xúc (ví dụ: từ trung tính sang tích cực) làm tăng 2.49 lần xác suất mua lại. Điều này chứng minh cảm xúc tích cực là yếu tố dự báo hành vi tiêu dùng mạnh mẽ, bên cạnh điểm số sao.
Phân tích theo nền tảng
Shopee:
Cụm từ như “giao hàng nhanh”, “đúng mô tả” liên quan đến đánh giá 5 sao trong 88.3% trường hợp.
Các đánh giá tiêu cực thường gắn với vấn đề hậu cần như “trễ lịch”, “hàng bị móp”, chiếm 11.9%.
Lazada:
Tỉ lệ đánh giá tích cực thấp hơn do nhiều người dùng phàn nàn về bảo hành và chăm sóc sau mua.
Sản phẩm từ gian hàng LazMall có tỉ lệ mua lại cao hơn 1.4 lần so với gian hàng thường.
Amazon:
Ngôn ngữ sử dụng giàu cảm xúc: các cụm như “worth every penny”, “high quality”, “exceeded expectation” xuất hiện nhiều hơn 5 lần so với các nền tảng còn lại.
Người dùng Amazon phản hồi chi tiết hơn (trung bình 53 từ mỗi đánh giá, cao gấp 2.2 lần Shopee).
Bảng 5: Tóm lược kết quả
Chỉ số
|
Shopee
|
Lazada
|
Amazon
|
---|---|---|---|
Tích cực (%)
|
72.3
|
68.7
|
81.6
|
Trung bình sao
|
4.34
|
4.17
|
4.58
|
Tỉ lệ mua lại (%)
|
19.6
|
17.2
|
26.1
|
Hiệu ứng cảm xúc (OR)
|
2.32
|
2.09
|
2.87
|
Nguồn: Tính toán của các tác giả
Các kết quả này xác nhận rằng cảm xúc tích cực trong đánh giá văn bản có mối liên hệ mạnh mẽ với các hành vi kinh tế như đánh giá cao và tái mua. Đây là nền tảng thực nghiệm để các doanh nghiệp TMĐT ứng dụng phân tích cảm xúc như một chỉ số dự báo hành vi khách hàng.
KHUYẾN NGHỊ VÀ KẾT LUẬN
Khuyến nghị chính sách và ứng dụng thực tiễn
Dựa trên kết quả nghiên cứu, một số khuyến nghị được đề xuất như sau:
Đối với doanh nghiệp thương mại điện tử:
Cần tích hợp phân tích cảm xúc vào hệ thống CRM để phát hiện sớm rủi ro rời bỏ khách hàng (churn) và phản hồi tiêu cực.
Ưu tiên hiển thị các đánh giá có nội dung tích cực chi tiết trong trang sản phẩm để tăng tỷ lệ chuyển đổi.
Phân tích cụm từ cảm xúc phổ biến theo từng ngành hàng để cải thiện mô tả sản phẩm, từ khóa SEO và truyền thông nội dung.
Đối với nền tảng thương mại điện tử:
Nên thiết kế hệ thống khuyến nghị dựa trên cảm xúc bên cạnh hệ thống truyền thống dựa trên hành vi.
Phân nhóm khách hàng theo ngữ điệu cảm xúc trong đánh giá để cá nhân hóa trải nghiệm.
Theo dõi xu hướng cảm xúc tập thể trên quy mô lớn để cảnh báo khủng hoảng truyền thông hoặc sự cố chuỗi cung ứng.
Đối với các nhà nghiên cứu:
Cần phát triển các mô hình nhận diện cảm xúc phức tạp hơn như tức giận, hoài nghi, mỉa mai… nhằm tăng độ tinh tế của phân tích.
Kết hợp dữ liệu cảm xúc với dữ liệu thời gian thực (ví dụ: thời điểm truy cập, độ dài phiên mua hàng) để nghiên cứu mô hình ra quyết định toàn diện hơn.
Phân tích chéo giữa cảm xúc ngôn ngữ và đặc điểm nhân khẩu học (nếu có dữ liệu) để cá nhân hóa sâu hơn các dự báo hành vi.
Kết luận
Trong kỷ nguyên dữ liệu lớn và TMĐT, cảm xúc không chỉ là một yếu tố mơ hồ mà trở thành một tín hiệu kinh tế số có thể đo lường, phân tích và tối ưu hóa. Việc ứng dụng học sâu để trích xuất cảm xúc từ hàng triệu đánh giá người tiêu dùng cho phép doanh nghiệp không chỉ hiểu khách hàng tốt hơn mà còn dự báo hành vi, cá nhân hóa dịch vụ, và nâng cao năng lực cạnh tranh trong một thị trường ngày càng khốc liệt. Nghiên cứu này khẳng định vai trò của cảm xúc trong kinh tế hành vi hiện đại, đồng thời đặt nền móng cho hướng đi mới trong việc kết nối công nghệ AI, NLP với thực tiễn quản trị trải nghiệm khách hàng trong thương mại điện tử.
Tài liệu tham khảo:
1. Archak, N., Ghose, A., & Ipeirotis, P. G. (2011). Deriving the pricing power of product features by mining consumer reviews. Management Science, 57(8), 1485-1509. https://doi.org/10.1287/mnsc.1110.1370
2. Nguyen, H. T., Tran, M. T., & Do, Q. H. (2022). Sentiment analysis of Vietnamese e-commerce reviews using multilingual BERT. Journal of Data Science & AI, 8(3), 44-58.
3. Oliver, R. L. (1997). Satisfaction: A behavioral perspective on the consumer. McGraw-Hill.
4. Pang, B., & Lee, L. (2008). Opinion mining and sentiment analysis. Foundations and Trends® in Information Retrieval, 2(1-2), 1-135.
5. Lazada Review Dataset (2021-2024). Crawl từ sản phẩm LazMall các ngành hàng điện tử, gia dụng.
6. Amazon Product Review Dataset (2018-2023). Stanford SNAP Repository. https://snap.stanford.edu/data/web-Amazon.html
Ngày nhận bài: 30/5/2025; Ngày hoàn thiện biên tập: 10/6/2025; Ngày duyệt đăng: 16/6/2025 |
https%3A%2F%2Fkinhtevadubao.vn%2Fphan-tich-cam-xuc-va-hanh-vi-tieu-dung-trong-thuong-mai-dien-tu-truong-hop-shopee-lazada-va-amazon-31545.html