今天用了2小时去阅读《The Art of SQL》这本书,受益良多,但有点后悔的是没有去直接阅读英文,中文的翻译更类似于机翻,很多会有语言表达不精确的问题。
null值出现的问题
有些表格因为前期的创建不规范,会出现大量的数据为空的情况,容易造成数据库冗余的问题。null值的出现大多数伴随着大量字段被强行加入到一张表中,从而造成数据项之间不匹配,产生空值问题。更加严重的会发生两个字段值异或的情况,即A值为空的时候B值有值,B值为空的时候A值有值。
数据库的值分为3种: 有值,无值和空值。
语句查询出现问题,譬如当where中运用到null语句的查值。
where color in ('BLUE', 'BLACK', null);
在这样的语句中SQL根本不能够判断是否是空值。
更加严重的情况会出现在
where color not in ('BLUE','BLACK',null)
因为sql 不能够判断null值具体代表什么含义,他会默认为全体值,所以不会返回结果,基本上就是一个bug。
同时空值锁表述的信息不明,譬如结束日期为空,表示的到底是还未结束,还是已经结束但不知道结束日期呢,容易引起歧义。
怎样解决null值出现的问题呢
-
建表的时候规整字段
譬如: 有些电话号码可以分为座机,手机和办公电话。可以将电话号码作为一个字段 telephone 使用,同时用telephone_type去表示分别是那种号码,1代表座机号,2代表手机,3代表办公电话,当同时出现多种值的时候,可以选择插入多条,或者另外生成一张表。 -
通过逻辑填补
譬如:当用户只输入了手机,座机和办公电话为空,则可默认填充手机号码,从而解决空值 -
设置default值
设置default值从而默认避免空值。
表格过宽的问题
表格过宽的意思是一种表格的字段项太多,容易引起数据冗余。
遇到表格过宽,我们一般的解决思路是分库分表,也就是把某个字段的不同类型,单独提出单独建表。譬如我们有不同类型的员工,则将员工提出单独建员工表。
表格中的历史数据怎么办
最典型的历史数据当属价格表。价格在现实生活中是变动的,所以一张表中的物品价格可能会有多条记录,而取到当前价格是最重要的。
处理表格中的历史数据方法
- 增加有效时间字段 effective_from_date,或者直接用create_time字段,查询出来一种物品的最高价格。
select a.article_name, h.price
from articles a, price_history h
where a.articles_id == h.articles_id
and h.effective_from_date = (select max(b.effective_from_date)
from price_history b where b.article_id = a.article_id)
但是这种方式使用了嵌套查询,并且全表查询,查询时间非常长。