Etsy最近发表了一篇博客文章,详细介绍了他们如何存储和管理结构化数据。Etsy 电商平台,以贩卖独一无二商品为特色。他们登录页面上的口号是:“手工的、复古的、定制的或独特的,尽在 Etsy。”这个口号揭示出,独特性是 Etsy 的卖点。只要商品属于满足这三个条件,就可以在这个市场上贩卖。
Etsy 的结构化数据组织定义了由类别、属性、值和范围组成的分类法。例如,分类中的某个项目可以有类别“靴子”,属性“女性鞋码”,值为“7”,范围为“英国”。Etsy 的分类法包含 6000 多个类别、400 个属性、3500 个值和 90 个范围。所有这些层次结构组合在一起形成了 3500 多个过滤器。JSON 文件用于表示分类法。每个类别有一个 JSON 文件,该文件包含该类别在层次树中的相对位置的信息,以及该类别中项目的属性、值和范围。
分类法用于两种情况。对于卖方,它用于在创建时将清单分类。当卖家创建新列表时,可以在分类法中选择类别。通过一个智能的、具有填写建议的文本框,可以选择最合适的类别。基于类别选择,JSON 提供了关于属性、值范围和地域的信息(例如,“女性鞋码”、“2…10”、“英国”)。这减少了对产品的过度描述,简化了卖方的流程,并确保 Etsy 只收集与类别有关的属性。
另一方面,买方使用分类法可以按类别和子类别进行搜索。每个类别都有自己的过滤器,这些过滤器由分类法定义。任何搜索查询都将通过大数据作业被分类到某个分类法类别,然后该类别将和该类别的过滤器一起显示给用户。
Etsy 的下一步将围绕结构化非结构化数据开展,如列表标题和描述。此外,Etsy 还使用机器学习来发现关于清单的更多信息。例如,可以通过提交的图像推断清单的颜色,而不是询问卖家。Etsy 的目标是使用结构化数据来推动更深入的分类体验,从而在买家和卖家之间建立更好的联系。
原文链接:
An Introduction to Structured Data at Etsy
评论