很多年轻人应该都使用过叮咚买菜,叮咚买菜app中我们可以买到新鲜蔬菜、水果、肉禽蛋、米面粮油、水产海鲜、南北干货、方便速食等等。但是现在疫情特殊时期,很多用户都叮咚买菜app下单购买商品,导致很多商品都缺货,那要怎么操作才能抢到菜呢,首先我们提前一天将想买的东西加入购物车,定好闹钟起来抢菜,疯狂点击下单付款即可。
虽然现在有好几款网上买菜的app,但是身边的朋友好像都比较喜欢叮咚买菜,那么我们今天就利用python爬虫技术去了解下大家对这款购菜app的评价吧。数据来源于,但是就像美团评价一样,这个网站评论数据的获取也是稍微有点难度的,最直接的就是会遇到网站封IP行为,这样的前提下我们只有先准备好高质量的爬虫代理才能去获取数据了。很多朋友表示不知道怎么选择高匿代理,那可以直接使用这家,爬虫程序都是比较简单的,如何在爬虫程序里面加上代理进行数据获取也是比较简单的,这里可以借着获取评论数据示例下:
// 要访问的目标页面 string targetUrl = "https://www.100.me/home/index"; // 代理服务器(产品官网 www.16yun.cn) string proxyHost = "http://t.16yun.cn"; string proxyPort = "31111"; // 代理验证信息 string proxyUser = "username"; string proxyPass = "password"; // 设置代理服务器 WebProxy proxy = new WebProxy(string.Format("{0}:{1}", proxyHost, proxyPort), true); ServicePointManager.Expect100Continue = false; var request = WebRequest.Create(targetUrl) as HttpWebRequest; request.AllowAutoRedirect = true; request.KeepAlive = true; request.Method = "GET"; request.Proxy = proxy; //request.Proxy.Credentials = CredentialCache.DefaultCredentials; request.Proxy.Credentials = new System.Net.NetworkCredential(proxyUser, proxyPass); // 设置Proxy Tunnel // Random ran=new Random(); // int tunnel =ran.Next(1,10000); // request.Headers.Add("Proxy-Tunnel", String.valueOf(tunnel)); //request.Timeout = 20000; //request.ServicePoint.ConnectionLimit = 512; //request.UserAgent = "Mozilla/5.0 (Windows NT 6.3; Win64; x64) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/48.0.2564.82 Safari/537.36"; //request.Headers.Add("Cache-Control", "max-age=0"); //request.Headers.Add("DNT", "1"); //String encoded = System.Convert.ToBase64String(System.Text.Encoding.GetEncoding("ISO-8859-1").GetBytes(proxyUser + ":" + proxyPass)); //request.Headers.Add("Proxy-Authorization", "Basic " + encoded); using (var response = request.GetResponse() as HttpWebResponse) using (var sr = new StreamReader(response.GetResponseStream(), Encoding.UTF8)) { string htmlStr = sr.ReadToEnd(); }
从获取的数据分析看了下,有觉得好用的,也有觉得不好用的,大家都是根据自己的使用感受发表的。任何产品都是不可能受到每个人的喜欢的,所以只要觉得适合自己的就好。
若有收获,就点个赞吧