天天日报丨大数据分析工具Power BI(五):数据模型介绍
数据模型介绍
一、模型关系
在数据分析过程中,我们会将数据表分为事实表和维度表两种类型的表。
(资料图)
发生在现实世界中的操作型事件,其所产生的可度量数值,存储在事实表中,事实表也叫明细表。例如,一个按照地区、产品、月份划分的销售量和销售额的事实表如下:
在以上事实表的示例中,"地区ID"、"产品ID"、"月份ID"为键值列,"销售量"、"销售额"为度量列,所谓度量列就是列的数据可度量,度量列一般为可统计的数值列。事实表中每个列通常要么是键值列,要么是度量列。事实表中一般会使用一个代号或者整数来代表维度成员,而不使用描述性的名称,例如:ID代号。上表中的"地区ID"、"产品ID"、"月份ID"就是维度列,就是观察数据的角度。使用代号或整数来代表维度成员的原因是事实表往往包含很多数据行,使用代号或整数这种键值方式可以有效减少事实表的大小。在事实表中使用代号或者整数键值时,维度成员的名称需要放在另一种表中,也就是维度表。通常事实表中的每个维度都对应一个维度表。在企业中采购记录表、订单表、库存明细表、商品流水表等都是事实表。
维度表维度表包含了维度的每个成员的特定名称。维度成员的名称称为"属性"(Attribute),假设"产品ID"维度表中有3种产品,例如:
如上图,"产品名称"是产品维度表中的一个属性,维度表中可以包含很多属性列。产品维度表中的"产品ID"与事实表中的"产品ID"相匹配,称为"键属性",在当前产品维度表中一个"产品ID"只有一个"产品名称",显示时使用"产品名称"来代替,所以"产品名称"也被认为是"键属性"的一部分。维度表中"键属性"唯一不重复。每个维度表中的键值属性都与事实表中对应的维度相匹配,在维度表中"产品ID"类似关系型数据库中的主键,在事实表中"产品ID"类似关系型数据库中的外键,维度表和事实表就是按照键值属性"产品ID"进行关联的。在维度表中出现一次的每个键值都会在事实表中出现多次。例如上图中,产品ID 中 1111在事实表中对应多行。在企业中客户信息表、人员信息表、区域信息表等都是维度表,Power BI中我们可以通过模型视图来创建两表或者多表之间的关系,这里建立的关系就是创建的事实表与维度表之间的关系。例如在资料中有"销售订单表A.xlsx"和"商品信息表.xlsx"两个excel表,销售订单表就是事实表,商品信息表就是维度表,通过前面学习的知识导入两表数据,分别命名为"销售订单表"和"商品信息表"如下:
当我们在新的Power BI中导入数据后,Power BI会自动根据表中的相同字段简历关联模型,点击"模型"视图,可以看到Power BI自动根据两表相同的字段检测并建立的数据关系模型:
Power BI会根据多表中相同的字段构建关系,如果两表中有关联的字段列名不同,也可以手动点击一张表中的列拖动到其他表中的关系列上构建关联关系,如下:
构建好关联关系后,可以在对应的报表中画图,图形中的列就可以来自于多个表,Power BI会根据两表之间的关联关系自动来绘制图形:
注意:如果两表没有关系,以上图形不能正常显示。
如果在Power BI中导入数据不希望自动构架关系,可以通过设置关闭自动构建关系,操作如下,将"加载数据后自动检测新关系"勾选掉即可,建议保留。
二、管理模型关系
Power BI中导入的数据表之间的关系也有可能不是以上维度表对应事实表一对一的关系,两表之间的关系有如下几种:
一对一关系:例如:"学生"是实体,"身份证"是实体,一个学生只能有一个身份证,一个身份证也只能对应一个学生。一对多关系:一对多关系反过来也就成了多对一的关系。例如:"学生"是实体,"账号"是实体,一个学生有多个账号,反过来就是多个账号对应一个学生。多对多关系:例如:"学生"是实体,"课程"是实体,一个学生可以学习多个课程,一个课程可以被多个学生学习,整体来看,学生学习课程就成了多对多的关系。通过Power BI导入的数据可能会有不完全符合需求的关系或者多余的关系。例如在资料中有"省份信息.xlsx"、"城市信息.xlsx"、"区县信息.xlsx"、"门店信息.xlsx"四个excel表,按照之前方式导入到PowerBI中,可以在"关系视图中"看到自动构建的关系:
以上关系中有一些不是我们想要的关系,例如:"省份信息"与"城市信息"关系,"城市信息"与"区县编号"关系。我们可以在"主页"的"管理关系"功能中进行维护关系,也可以在对应的关系线上右键删除对应的关系。
关键词:
精心推荐
- 去年京津冀工信部门推进签约570多项高端高新项目
- 京津冀区域协同创新指数增长迅速
- 1至2月河北省工业生产平稳开局 规模以上工业增加值同比增长6.0%
- 浙江绍兴15日0-21时新增41例确诊病例
- 沈阳大气优良天数达近5年来最好水平
- 辽宁实行市级政府集中监管 首站定点冷库加强疫情防控
- 辽宁省25个博士后团队冲刺全国博士后创新创业大赛
- 安徽省宿州市埇桥区大营镇大营新村调整为中风险地区
- 云南哀牢山4名地质调查人员因公殉职原因查明
- 全国首部涉及“非现场执法”的法规施行 浦东新区打造引领区数字化城市治理样板
- 杭州一封控小区完成第三轮核酸检测 前两轮检测均为阴性
- 集采未中选药品现在怎么样了?这组数据告诉你
- “海归”博士后王暾:专注灾害预警科技创新 打通灾害预警“最后一公里”
- 福建宣判一起涉恶案件 10人犯罪团伙强迫交易、非法采矿获刑
-
中新网郑州12月15日电 (记者 韩章云)针对近日网友实名举报中国农业发展银行太康县支行员工夏某华吃空饷一事,中国农业发展银行河南省
-
中新网宿迁12月15日电 (记者 刘林)“房子干净又敞亮,社区漂亮又整洁。”15日,家住江苏宿迁牛角淹社区的袁有亮谈起新家,兴奋的心情
-
中新网通辽12月15日电 (记者 张林虎)15日,记者从内蒙古自治区通辽市科左后旗公安局获悉,该局打掉一个帮助网络犯罪转账的“跑分团队
-
中新网安徽阜阳12月15日电 ( 成展鹏)12月15日,规划占地面积2500亩、投资总额75亿元的安徽省阜阳市太和县保兴医药健康产业园内一片繁
-
中新网杭州12月15日电 (郭其钰 张益聪)从焦虑不安到互帮互助,浙江省杭州市上城区凯旋街道新城市广场B座里的257人经历了难忘的72小时
X 关闭
行业
- 1、天天日报丨大数据分析工具Power BI(五):数据模型介绍
- 2、天天看热讯:集智股份: 杭州集智机电股份有限公司2022年度募集资金存放与使用情况鉴证报告
- 3、【环球播资讯】腾讯控股:今日回购96万股 耗资约3.52亿港元
- 4、每日讯息!使用碳纤维纸代替铜薄膜,提高锂电池稳定性和能量密度
- 5、快资讯丨八旬老人看急诊遇医生“线上学习”耽误十多分钟,医院回应
- 6、微资讯!伊藤美诚“拒绝”代表日本出战!疑似遭到区别对待,国乒损失巨大
- 7、天天时讯:博泰车联网携手思普
- 8、【世界报资讯】全国壁球锦标赛在大连举办
- 9、【天天新要闻】医保暂停参保可以报销吗?医保暂停参保如何恢复正常参保?
- 10、每日视点!QQ斗地主上面的级别是怎样划分的_划分的级别盘点
X 关闭
产业
-
不用跑北京 在家门口也能挂上顶...
日前,我省首个神经疾病会诊中心——首都医科大学宣武医院河北医院...
-
“十四五”期间 河北省将优化快...
从省邮政管理局获悉,十四五期间,我省将优化快递空间布局,着力构...
-
张家口市宣化区:光伏发电站赋能...
3月19日拍摄的张家口市宣化区春光乡曹庄子村光伏发电站。张家口市宣...
-
“张同学”商标被多方抢注 涉及...
“张同学”商标被多方抢注,官方曾点名批评恶意抢注“丁真” ...
-
山东济南“防诈奶奶团”花式反诈...
中新网济南12月15日电 (李明芮)“老有所为 无私奉献 志愿服...
-
广州新增1例境外输入关联无症状...
广州卫健委今日通报,2021年12月15日,在对入境转运专班工作人...
-
西安报告初筛阳性病例转为确诊病例
12月15日10:20,经陕西西安市级专家组会诊,西安市报告新冠病毒...
-
广东东莞新增本土确诊病例2例 ...
(抗击新冠肺炎)广东东莞新增本土确诊病例2例 全市全员核酸检测...
-
中缅边境临沧:民警深夜出击捣毁...
中新网临沧12月15日电 (胡波 邱珺珲)记者15日从云南临沧边境...
-
“土家鼓王”彭承金:致力传承土...
中新网恩施12月15日电 题:“土家鼓王”彭承金:致力传承土家...