9.质性数据分析——理解电商平台中的商品特征

淘宝、拼多多、京东搜索结果中的商品属性、服务标签、促销图标等分布研究

💻交互式文档(商品属性) 💬向助教提问 🧺采集数据 1、质性数据分析——理解电商平台中的商品特征 在今天的数字化时代,电商平台如淘宝、拼多多、京东等已经成为我们日常购物的主要渠道。每一次在这些平台上搜索商品时,我们都会接触到大量的商品信息,比如商品的品牌、款式、面料、服务标签、促销图标等。这些信息不仅决定了我们是否选择购买某个商品,更能反映出商家和平台的营销策略。很多人可能不...…
9.质性数据分析——理解电商平台中的商品特征
分享此内容

💻交互式文档(商品属性) 💬向助教提问 🧺采集数据

1、质性数据分析——理解电商平台中的商品特征

在今天的数字化时代,电商平台如淘宝、拼多多、京东等已经成为我们日常购物的主要渠道。每一次在这些平台上搜索商品时,我们都会接触到大量的商品信息,比如商品的品牌、款式、面料、服务标签、促销图标等。这些信息不仅决定了我们是否选择购买某个商品,更能反映出商家和平台的营销策略。很多人可能不知道,这些商品特征和标签,其实属于质性数据的一部分。

本文附带了两个交互式文档,分别用于分析淘宝搜索的商品属性数据和服务标签数据,参见文章开头和末尾。

什么是质性数据?

质性数据,也叫定性数据,是一种描述性的、非数值化的信息,通常用于表示事物的特征或类别。在电商平台中,我们经常接触到的商品属性,如“品牌”、“款式”、“面料”等,都是典型的质性数据。它们描述了商品的具体特征,但不能直接用数字来量化。例如,“品牌”可以是“苹果”、“华为”或“小米”;“款式”可以是“运动款”或“休闲款”;“面料”可能是“棉麻”、“涤纶”或“羊毛”。

除了商品本身的属性,电商平台上还有许多与商品相关的质性数据。例如,“服务标签”可以是“包邮”、“跨店每X减X”或“退货宝”,这些标签告诉我们关于商品附加服务的信息;“促销图标”则可能包括“限时折扣”、“新品”、“满减”等,这些图标展示了商品当前的促销活动。

质性数据分析的意义

那么,为什么我们需要分析这些质性数据呢?答案很简单:这些数据能帮助我们深入了解市场、消费者需求以及产品竞争力。在电商平台上,消费者的购买决策往往不仅仅基于价格,更多的是受到商品特征和附加服务的影响。而商家和平台通过精确分析这些质性数据,能够发现潜在的市场趋势、优化产品推荐策略、提升销量,甚至制定更加精细的定价和促销策略。

举个例子,假设你在淘宝搜索“牛仔裤”时,会看到不同品牌、款式、面料的裤子,甚至可能有些裤子打着“满减优惠”或者“限时折扣”的标签。如果我们能够通过分析这些质性数据,比如哪些品牌的裤子销量更好,哪些款式或面料的裤子更受欢迎,就能帮助商家了解消费者偏好,从而优化产品布局和营销方案。

质性数据的分析方法

质性数据虽然不像数值数据那样直接可以做加减乘除的运算,但我们同样可以通过一些方法进行分析。常见的质性数据分析方法包括:

  1. 分类分析:将不同的商品属性、服务标签和促销图标归类,分析它们在不同商品中的分布。例如,我们可以分析哪些品牌的商品更受欢迎,哪些款式的商品销售更好。

  2. 频次分析:统计某一属性值的出现频率,如“牛仔裤”中有多少商品标注了“包邮”标签,或“棉麻”面料在裤子中占的比例。通过频次分析,我们可以发现消费者偏好的商品特征。

  3. 关联分析:通过关联规则挖掘,分析不同属性之间的关系。例如,某些品牌的裤子是否更多地配有“限时折扣”标签,或者“休闲款”裤子是否更常见于“新品”类别。

  4. 可视化分析:使用图表和散点图等方式,将不同商品属性与销量、价格等其他数据关联起来,帮助商家更直观地了解不同商品特征的市场表现。

小结

在电商平台上,商品的品牌、款式、面料、服务标签和促销图标等质性数据,不仅构成了我们日常购物决策的依据,也为商家和分析师提供了丰富的市场信息。通过质性数据分析,我们可以更好地理解市场趋势、优化产品策略,进而提升销售业绩。在接下来的章节中,我们将进一步探讨如何通过技术手段,利用这些质性数据进行深入分析,帮助商家做出更加精准的决策。

2. 淘宝搜索的质性数据——商品属性

在电商平台上,分析商品价格、月销量以及商品属性的分布对于商家、市场分析师以及消费者决策具有重要意义。本研究通过对淘宝搜索结果进行数据清洗、处理,并可视化商品的价格和月销量,同时将商品属性用不同的颜色表示,从而探索不同商品特征对销售情况的影响。本报告旨在帮助读者理解如何基于电商记插件的数据处理能力,定制和自定义不同的数据输入、属性筛选和可视化参数。

2.1 数据上传

用户可以上传包含淘宝搜索结果的Excel文件(用电商记插件的新版淘宝搜索流程采集),数据应包括商品的“价格”、“月销量”和“属性”字段。该数据文件应由电商记插件采集,支持“综合排序”和“销量排序”两种数据源。

“属性”字段记录了每个商品的一系列属性名、属性值,形式如下图所示。 Screenshot%20from%202025-02-23%2020-43-05

在代码中,我们通过一个文件上传界面使用户能够上传数据。具体操作如下:

<input class="btn btn-primary" type="file" id="fileInput" multiple />

数据上传是本文研究使用的交互式文档的第1步,用户可按下图所示步骤修改和运行单元格。

Untitled-2025-02-23-1

2.2 数据清洗与处理

上传的Excel文件包含多个字段,其中我们关注“价格”、“月销量”和商品的“属性”字段。在数据处理中,首先读取Excel文件并跳过前两行,然后筛选出这三个字段:

df_zonghe = taobao.process_data(pd.read_excel(excel_file_path, skiprows=2, usecols=['商品ID','价格','月销量', '属性'], sheet_name = "综合"), field_attribute = '属性', max_x = 1000, max_y = 10000)
df_xiaoliang = taobao.process_data(pd.read_excel(excel_file_path, skiprows=2, usecols=['商品ID','价格','月销量', '属性'], sheet_name = "销量"), field_attribute = '属性', max_x = 1000, max_y = 10000)

这段代码读取了“综合排序”和“销量排序”两个表格,并对“价格”和“月销量”数据进行了清洗与预处理,去除了无效数据。

2.3 商品属性处理

通过对数据进行处理,提取了每个商品的属性。为了便于后续的可视化分析,筛选出了含有2到10个值的有效属性,并在输出中列出了综合排序和销量排序的属性列表:

attributes_zonghe = taobao.process_attribute(df_zonghe, field_attribute = '属性')
attributes_xiaoliang = taobao.process_attribute(df_xiaoliang, field_attribute = '属性')

在这里,我们进一步筛选出了符合特定条件的属性,以便为后续的属性可视化做准备。

2.3 属性与颜色的匹配

为了将商品的属性与散点图中的颜色进行匹配,我们选择了10个最有意义的商品属性,并为每个属性选定了一种颜色。选择属性时,优先考虑能够显著区分商品特征且对购买决策有重大影响的属性,如颜色、大小、形状等。

属性与颜色的映射如下:

selected_attributes = {
    "适用对象": {"青少年": "Pale Burnt Lake"},
    "基础风格": {"青春流行": "White"},
    "裤长": {"长裤": "Light Brown Drab"},
    "厚薄": {"加绒加厚": "Eugenia Red-A"},
    "腰型": {"中腰": "Vandyke Red"},
    "适用季节": {"四季通用": "Ochre Red"},
    "颜色": {"深色": "Coral Red"},
    "面料功能": {"抗皱": "Etruscan Red"},    
    "服装版型": {"宽松型": "Hay's Russet"}
}

这些属性会被用作散点图中的颜色区分,帮助用户更直观地理解不同商品在价格和月销量上的分布。

2.5 绘制散点图

我们通过散点图展示了淘宝搜索结果中的商品价格与月销量的关系。在散点图中,不同的商品属性用不同的颜色进行表示,属性的每个值用不同的散点标记。

绘制散点图的函数plot_attributes如下:

def plot_attributes(df, attributes, selected_attributes, field_x, field_y, field_attribute, caption):    
    for attribute_key, attribute_value in selected_attributes.items():            
        if not attribute_key in attributes:
            continue
        primary_value = next(iter(attribute_value))    
        primary_color = attribute_value[primary_value]
        values = attributes[attribute_key]
        colors = palette.color_picker(primary_color, len(values), hex_only = True)
        full_colors = []
        plt.figure(figsize=(18, 6))
        for i in range(0, len(values)):        
            attribute_value = values[i]
            attribute_color = palette.set_brightness(colors[i], 1.0)
            full_colors.append(attribute_color)
            pattern = attribute_key + ':' + attribute_value
            df_subset = df[df[field_attribute].str.contains(pattern)]   
            plt.scatter(df_subset[field_x], [y + 50 * random.random() for y in df_subset[field_y]], c = attribute_color, edgecolors = '#A0A0A0', alpha=0.5, s = 15, label = attribute_value, linewidths=1)
        plt.title(caption + ' ' + attribute_key, font=font)
        plt.xlabel(field_x, font=font)
        plt.ylabel(field_y, font=font)
        plt.grid(True)
        plt.legend(prop = font)
        plt.show()
        plt.close()

该函数遍历了选择的属性,将每个属性值映射到散点图上的特定颜色,并绘制每个属性值的散点。通过这种方式,用户可以直观地看到不同商品属性如何影响价格和月销量。

2.6 自定义模板

用户可以根据实际需求修改以下内容,以生成定制的分析报告:

  • 自定义商品属性:用户可以选择不同的商品属性,例如“店铺标签”、“服务标签”、“促销图标”等,替代原本的“属性”字段。
  • 更改数据文件:可以通过替换淘宝Excel文件为其他平台(如京东、拼多多)的数据文件,或将数据来源修改为其他格式。
  • 调整筛选条件:在process_attribute函数中,可以根据需要调整属性筛选的条件,选择更多或更少的属性进行分析。
  • 修改散点图参数:用户可以修改plot_attributes函数中的散点图参数,如图像大小、颜色、透明度、散点大小等,以适应不同的可视化需求。

通过上述分析与可视化方法,商家、分析师或用户可以深入了解商品在淘宝平台上的市场表现。根据用户上传的数据和选择的属性,可以灵活定制不同的分析报告和可视化效果,从而做出更加精准的商业决策。

3、淘宝服务标签的质性研究

3.1 服务标签的商业价值

对淘宝搜索中的服务标签进行质性分析具有重要的商业意义。淘宝的服务标签不仅仅是商品的附加说明,它们是平台为提升消费者购物体验、增加销量和吸引特定消费群体所设计的重要营销工具。通过对这些服务标签的质性分析,商家和分析师可以获得对消费者行为、市场需求和竞品优势的深入理解,从而做出更加精准的营销决策。

首先,服务标签直接反映了商品的附加价值。例如,“包邮”标签意味着消费者可以免除运费,这在价格敏感的消费者中往往能产生强烈的吸引力。类似的,“退货宝”标签为消费者提供了额外的退货保障,这对于担心网购风险的消费者尤其具有吸引力。而“淘金币已抵X元”则是淘宝通过其虚拟货币提供额外优惠,吸引那些已积累了淘金币的用户购买。这些标签帮助商家提供附加值,提高商品的竞争力。

其次,服务标签对消费者的购买决策具有显著影响。研究表明,消费者在选择商品时不仅仅考虑价格和品牌,还会考虑商品是否具备某些额外的优惠或保障。比如,"跨店每X减X"标签对于打算进行跨店购物的消费者来说,是一个很强的购买动机。同样,“限时直降X元”标签则能够创造紧迫感,促使消费者在有限的时间内做出购买决策。因此,商家和平台可以通过分析这些服务标签的影响力,了解不同服务标签对销售的具体促进作用,进而调整促销策略或优化商品展示。

此外,服务标签也能反映出不同商品的市场定位和目标消费群体。例如,“全球购”标签通常标识的是进口商品,目标群体可能是对海外商品有需求的消费者;而“公益宝贝”标签则可能吸引那些关心社会责任、喜欢参与公益活动的消费者。通过对这些服务标签进行分类和分析,商家可以根据消费者的需求进行个性化推荐,提高转化率。

从市场趋势的角度来看,服务标签的变化和流行也能够反映出消费者偏好的变化。例如,“淘工厂”标签的流行可能意味着消费者对于性价比高的工厂直销产品有了更大的需求,而“ifashion”标签的出现则可能是响应了年轻消费者对时尚潮流的需求。通过对这些趋势的分析,商家不仅可以及时调整商品的定价策略,还能预测市场的下一步发展方向。

最后,服务标签还可以帮助平台和商家进行差异化竞争。在竞争激烈的市场环境中,不同的标签能够帮助商品从众多同类商品中脱颖而出。例如,在同样的商品条件下,带有“全网低价”或“官方立减X元”标签的商品,往往能够吸引到更多的眼球和点击量。这不仅提高了商品的曝光率,也有助于提升销售额。

通过对淘宝搜索结果中服务标签的质性分析,商家可以获得有关消费者偏好、市场需求和商品竞争力的有价值见解。这些分析不仅有助于优化营销策略,还能够提升商品的市场表现和销售效率。随着数据分析技术的不断发展,商家和平台能够更加精准地理解不同服务标签在各种消费者群体中的影响力,从而做出更加科学的决策,推动销售增长。

3.2 服务标签的格式

淘宝搜索结果Excel数据(用电商记插件的新版淘宝搜索流程采集),有一个“服务标签”字段,记录了每个商品上具备的若干项服务,如下所示。 Screenshot%20from%202025-02-23%2020-43-58

3.3 修改交互式文档

新的数据处理方法:服务标签属性

在修改后的源代码中,处理的商品属性由原来的“通用属性”改为“服务标签”属性。新的“服务标签”属性包括如下值:

  • 包邮
  • 跨店每X减X
  • 退货宝
  • X期
  • 公益宝贝
  • 淘金币已抵X元
  • 全网低价
  • 淘工厂
  • 新品
  • 已补X元
  • X期
  • 官方立减X元
  • ifashion
  • X天价保
  • 淘金币抵X元
  • 限时直降X元
  • 全球购

为了更好地处理这个新的属性,首先进行了一个自定义的清洗函数replace_numbers_with_X,该函数会将服务标签中的数字部分替换为“X”。这是因为服务标签中可能包含不同的数值信息,替换为“X”后可以使数据更加标准化,便于后续分析。

def replace_numbers_with_X(s):
    return re.sub(r'-?\d+\.?\d*', 'X', s)

def process_service(df, field_attribute = '服务标签'):
    df[field_attribute] = df[field_attribute].apply(replace_numbers_with_X)

该方法会被应用到两个数据集(“综合排序”和“销量排序”),对服务标签进行标准化处理。

修改后的属性筛选

在对服务标签属性进行处理后,我们需要筛选出有效的属性并进一步分析。在代码中,我们设置了过滤条件,保留2到20个值的属性。通过调用taobao.process_attribute方法,我们能够提取出有效的属性,并显示在控制台中:

attributes_zonghe = taobao.process_attribute(df_zonghe, field_attribute = field_attribute)
attributes_zonghe = {k: v for k, v in attributes_zonghe.items() if 2 <= len(v) <= 20}

attributes_xiaoliang = taobao.process_attribute(df_xiaoliang, field_attribute = field_attribute)
attributes_xiaoliang = {k: v for k, v in attributes_xiaoliang.items() if 2 <= len(v) <= 20}

打印出的“综合排序”有效服务标签属性显示了所有相关服务标签,筛选后仅保留了频次在2到20之间的标签:

# 综合排序有效属性
{'服务标签': ['包邮', '跨店每X减X', '退货宝', ' X期', '公益宝贝', '淘金币已抵X元', '全网低价', '淘工厂', '新品', '已补X元', 'X期', '官方立减X元', 'ifashion', 'X天价保', '限时直降X元', '淘金币抵X元', '全球购']}

属性与颜色的设置

在新的源代码中,我们手动选择了“跨店每X减X”作为要分析的第一个服务标签属性值,并为其指定了颜色("Ochre Red")。这个属性值的颜色映射如下:

selected_attributes = {
    "服务标签": {"跨店每X减X": "Ochre Red"}
}

通过手动选择了“跨店每X减X”作为目标属性值,我们可以对其进行专门的散点图分析。

绘制散点图

在绘制散点图时,函数plot_attributes会根据所选的属性(即“服务标签”)及其值(如“跨店每X减X”)将不同的商品数据用不同的颜色表示。在这里,我们通过颜色映射对服务标签进行可视化,并绘制出价格与月销量的关系图。散点图的代码与之前基本一致,唯有图的尺寸作了调整:

def plot_attributes(df, attributes, selected_attributes, field_x, field_y, field_attribute, caption):    
        ...
        plt.figure(figsize=(18, 12))
        ...

该函数会遍历选择的服务标签属性,将每个标签(如“跨店每X减X”)用指定的颜色绘制在散点图上。图中展示的是价格与月销量的关系,同时可以看到每个服务标签在不同价格和销量区间的分布。

结果展示

最终,我们使用plot_attributes函数绘制了两个散点图,分别展示了综合排序和销量排序中的“跨店每X减X”服务标签与价格、月销量之间的关系:

plot_attributes(df_zonghe, attributes_zonghe, selected_attributes, '价格', '月销量', field_attribute, '淘宝搜索综合排序')
plot_attributes(df_xiaoliang, attributes_xiaoliang, selected_attributes, '价格', '月销量', field_attribute, '淘宝搜索销量排序')

这两张散点图能够帮助用户分析“跨店每X减X”标签对商品价格和销量的影响,直观地展示该服务标签在淘宝商品中的分布情况。

下图是淘宝搜索结果综合排序的服务标签散点图。 plot%20%282%29

总结

通过这次修改,源代码实现了对“服务标签”属性的自定义处理,并通过手动选择了一个特定的服务标签(“跨店每X减X”)进行分析。用户可以根据需要选择不同的服务标签、调整颜色映射,进而绘制出定制的散点图。这些修改增强了报告的可定制性和分析深度,适用于不同类型的商品属性分析。

第4章:淘宝搜索结果销量排序的服务标签分析

在这一章中,我们将详细解读淘宝搜索结果中,基于销量排序的服务标签的散点图。这幅图展示了不同商品的价格与月销量之间的关系,同时通过颜色区分了商品所附带的服务标签。通过分析这些数据,我们能够深入了解淘宝平台上不同服务标签对商品销售的影响,并探索消费者购买行为和市场趋势。

1. 散点图概览

从图表中可以看出,散点图的X轴表示商品的价格,Y轴表示商品的月销量。每一个点代表一个商品,它的位置由商品的价格和月销量决定,而每个点的颜色则代表商品所附带的不同服务标签。服务标签的种类包括但不限于“包邮”、“跨店每X减X”、“公益宝贝”等。

通过颜色的区分,我们可以很清楚地看到,不同的服务标签是如何分布在价格与销量的不同区域的。图中展示了服务标签如何在不同价格范围内影响商品的销量分布,帮助我们洞察市场需求和消费者偏好。

plot%20%281%29

2. 服务标签的分布

从散点图中可以看到,某些服务标签的商品主要集中在低价格区域,而另一些标签则更多地出现在高价商品中。以下是一些主要观察结果:

  • 包邮:这个标签在低价格商品中最为常见,尤其是在月销量较高的商品中。可以推测,免运费的优惠对于低价商品的购买决策有着显著的推动作用,消费者往往更愿意购买那些提供包邮服务的商品。

  • 跨店每X减X:这一服务标签在价格较高的商品中表现较为突出,尤其是价格在300元至500元区间的商品。显然,消费者对于跨店购物有一定的需求,特别是在商品价格较高时,跨店优惠能够有效地提升销量。

  • 公益宝贝:这个标签主要分布在价格较低且销量较少的商品上。这可能表明,商家通过公益标签吸引特定消费群体的关注,尽管这些商品的销量相对较低,但它们可能更具有社会责任感,吸引注重社会价值的消费者。

  • 淘金币已抵X元:在价格较低和中等价位的商品中,带有淘金币抵扣标签的商品较为集中。淘金币能够为消费者提供额外的购买优惠,显然这种服务对低价商品和中价商品有一定的吸引力,特别是那些已经积累了一定金币的消费者。

  • 限时直降X元:这一标签主要分布在价格中等至高价区间,尤其是在月销量较高的商品中。限时优惠能够在短时间内吸引消费者的注意,创造购买紧迫感,尤其适用于促销活动。

3. 价格与销量的关系

散点图显示,低价商品的销量普遍较高,这与消费者的购买习惯相符。对于大部分消费者来说,价格较低的商品更容易被购买。然而,随着价格的提升,销量呈现出逐渐下降的趋势,但在一些高价商品中,带有特定服务标签的商品销量仍然表现突出,特别是“跨店每X减X”和“限时直降X元”标签。这表明,尽管价格较高,但通过提供优惠或附加服务,商家仍然能够吸引消费者进行购买。

此外,我们还可以看到,服务标签对销量的影响并不仅仅取决于价格。在某些情况下,即使商品价格较低,但如果没有合适的服务标签,销量可能仍然无法达到预期。这进一步证明了服务标签在消费者决策中的重要作用。

4. 市场趋势与消费者行为

从这幅散点图中,我们可以提取出一些有价值的市场趋势:

  • 服务标签的作用:服务标签,如“包邮”、“限时折扣”和“淘金币抵X元”,在促使消费者做出购买决策方面起着至关重要的作用。商家应根据不同的价格区间选择合适的标签,以便吸引更多的消费者。

  • 高价商品的市场需求:对于高价商品,消费者在选择时更倾向于考虑附加优惠或保障措施,如“跨店每X减X”和“官方立减X元”。这表明商家可以通过提供具有竞争力的优惠来提高高价商品的销量。

  • 消费者偏好的多样化:不同的服务标签满足了不同消费者群体的需求。例如,注重社会责任的消费者可能更倾向于选择“公益宝贝”标签的商品,而追求购物实惠的消费者则更青睐“包邮”或“限时直降X元”等标签。

5. 结论

通过对淘宝搜索结果中服务标签的散点图进行分析,我们可以看出,服务标签在淘宝平台上的商品定价、销量以及消费者的购买决策中扮演了重要角色。商家可以根据不同商品的价格区间和目标消费者群体,合理选择和组合服务标签,最大化商品的销售潜力。同时,消费者在选择商品时,除了价格因素,还会受到服务标签的显著影响,这为商家提供了优化促销策略和提高转化率的机会。

在未来的市场分析中,我们将继续关注服务标签的演变,探索其与其他因素(如商品评价、品牌效应等)之间的相互作用,以便为商家提供更加精确的销售和营销建议。

💻交互式文档(服务标签) 💬向助教提问 🧺采集数据