Rails Model 中使用 Enum (枚举)
1. ActiveRecord::Enum 介绍
在 Rails 的 ActiveRecord 中,有一个 ActiveRecord::Enum 的 Module,即枚举对象。
Declare an enum attribute where the values map to integers in the database, but can be queried by name.
给数据库中的整型字段声明一个一一对应的枚举属性值,这个值可以以字面量用于查询。
拿到具体的运用场景中去考虑,Enum 的主要用于数据库中类似于 状态(status) 的字段,这类字段用不同的 整数(Integer) 来表示不用的状态。如果不使用 Enum,那就意味着我们代码中会出现很多表示状态的数字,他们可能会出现在查询条件里,也可能会出现在判断条件里,除非你记得或者拿着数据字典去看,否则你很难理解这段代码的含义。
代码中,以数字方式去表示数据状态,导致代码可读性被破坏,这样的数字被称为『魔鬼数字』。
Enum 就是 Rails 用来消灭魔鬼数字的工具。
2. ActiveRecord::Enum 的使用
常规用法:
# migration
create_table :conversations do |t|
t.integer :status, default: 0
end
# model
class Conversation < ActiveRecord::Base
# 相比起使用 Hash,数组相当于隐式指定了数字键值,字面量的顺序就很关键
enum status: [ :active, :archived ]
# or, recommended
enum status: {active:0, archived:1}
end
conversation.active! # = conversation.update! status: 0
conversation.active? # => true
conversation.status # => "active"
conversation.archived! # conversation.update! status: 1
conversation.archived? # => true
conversation.status # => "archived"
conversation.status = "archived" # conversation.status = 1
conversation.status = nil
conversation.status.nil? # => true
conversation.status # Conversation.where(status: active) => nil
Conversation.statuses
提供默认scope:
Conversation.active # => Conversation.where(status: 0)
Conversation. archived # => Conversation.where(status: 1)
获得一个名为 statuses 的 HashWithIndifferentAccess
Conversation.statuses #=> { "active" => 0, "archived" => 1 }
Conversation.statuses[:active] # => 0
Conversation.statuses["archived"] # => 1
3. ActiveRecord::Enum 在 Rails 5.0+ 中的新特性
- where 查询支持直接使用字面量做查询条件
# 在 Rails 4.1+ 中
Conversation.where(status: %i[active waiting]).to_sql
# => "SELECT `conversations`.* FROM `conversations` WHERE `conversations`.`status` IN (NULL, NULL)"
# 惊不惊喜,意不意外,这也是 4.x 版本 Enum 比较鸡肋的原因,正确的你应这样写
Conversation.where(status: %i[active waiting].map { |s| Conversation.statuses[s] }).to_sql
# => "SELECT `conversations`.* FROM `conversations` WHERE `conversations`.`status` IN (0, 1)"
# 好在,Rails 5.0 之后就可以这么用了
Conversation.where(status: %i[active waiting]).to_sql
# => "SELECT \"conversations\".* FROM \"conversations\" WHERE \"conversations\".\"status\" IN (0, 1)"
# BUT,当你选择手写 SQL 查询条件的时候,仍是需要自己转义的
Conversation.where("status <> ?", Conversation.statuses[:archived])
- conversation[:status] 与 conversation.status 返回值一致,都是字面量
conversation.status # => "active"
conversation[:status] # => "active"
Conversation.pluck(:status) # => ["active", "archived", ...]
- 增加了两个可选参数 _prefix 和 _suffix
在 Rails 4.1+ 的版本中,即使是不同的 enum 字段也不能有同名的值
# user.rb
enum status: [:temporary, :active, :deleted]
enum admin_status: [:active, :super_admin]
# rails console
irb(main):001:0> u = User.new
ArgumentError: You tried to define an enum named "admin_status" on the model "User", but this will generate a instance method "active?", which is already defined by another enum.
...
于是在 Rails 5 中,引入了 _prefix 和 _suffix 两个选项来解决这个问题,它会给对应的 !、? 以及 scope 方法加上前/后缀以示区分
# user.rb
enum status: [:temporary, :active, :deleted], _suffix: true
enum admin_status: [:active, :super_admin]
# rails console
user = User.active_status.first
user.active_status?
user.deleted_status!
# user.rb
enum status: [:temporary, :active, :deleted], _suffix: :stat
enum admin_status: [:active, :super_admin]
# rails console
user = User.active_stat.first
user.active_stat?
user.deleted_stat!
4.实际使用中的一些经验总结
- 不要使用数据库的 enum !!!
- 尽量升级到 Rails 5 以上的版本
- 对 enum 字段赋值时,已经隐含了数据验证
- 尽量不要使用数组来定义 enum
-
手动设置了 table_name 时,需要警惕关联查询的陷阱
注:这条是 Rails 5.x 的专属烦恼
# post.rb
class Post < ActiveRecord::Base
self.table_name = :articles
has_many :comments
enum category: { it: 0, law: 1, medical: 2 }
end
# comment.rb
class Comment < ActiveRecord::Base
belongs_to :post, foreign_key: :article_id
end
# 正常查询是 OK 的
Post.law.to_sql
#=> "SELECT \"articles\".* FROM \"articles\" WHERE \"articles\".\"category\" = 1"
# 作为关联表的查询条件,enum 字段就无法转义了,查询会报错
Comment.joins(:post).where(articles: { category: :law }).to_sql
# => "SELECT \"comments\".* FROM \"comments\" INNER JOIN \"articles\" ON \"articles\".\"id\" = \"comments\".\"article_id\" WHERE \"articles\".\"category\" = 'law'"
# 故意写个错的查询,看看错出在哪儿
Comment.joins(:post).where(post: { category: :law }).to_sql
# => "SELECT \"comments\".* FROM \"comments\" INNER JOIN \"articles\" ON \"articles\".\"id\" = \"comments\".\"article_id\" WHERE \"post\".\"category\" = 1"
通过这个对比可以发现,因为手动设置了 table_name 时,关联表查询需要指定真实的表名,这会导致 enum 字段无法被正确转义
前方高能预警,神坑要来了!!!
猜猜这个查询会不会报错?能不能查出数据?
Comment.joins(:post).where(articles: { category: [:law] })
答案是:不会报错,会查到数据,但绝不是你想要的
Comment.joins(:post).where(articles: { category: [:law] }).to_sql
# => "SELECT \"comments\".* FROM \"comments\" INNER JOIN \"articles\" ON \"articles\".\"id\" = \"comments\".\"article_id\" WHERE \"articles\".\"category\" = 0"
where
条件里面变成了 "articles"."category" = 0
, 也就是查出了条件为 { category: :it }
的数据,够惊悚吧
所以,遇到这种情况,最好自己做转义!自己做转义!自己做转义!
-
给 enum 字段添加默认值是一个好习惯
默认值最好还是定义的属性值里的第一个,通常来说是『0』
create_table :conversations do |t|
t.integer :status, limit: 2, default: 0, null: false
end
-
添加新属性时,最好写一个迁移
加属性值的时候,并不涉及到数据库变动,为什么要写迁移呢?当然这不是必须的,建议写主要出于两项考虑
检测当前数据库中新加的值是否已经被占用
更新数据库字段的 comment
当多个系统使用同一张数据表的时候,可能会出现 A 系统加了一个新的状态 { deleted: 3 },B 系统不知道,也添加了一个 { reactive: 3 } 的新状态,等到某天其中一方发现问题时,线上的数据早已经是一团浆糊了。
所以在这种情况下,应该写一个迁移
class AddDeletedStatusToConversations < ActiveRecord::Migration[5.1]
def up
raise "The value of deleted status has already been taken." if Conversation.deleted.count.positive?
change_column :conversations, :status, :integer, default: 0, null: false, comment: "0 - active, 1 - waiting, 2 - archived, 3 - deleted"
end
end
虽然这并不能保证万无一失,但及时的修改 comment 至少还是一个好习惯,毕竟使用数据库的可能不止是写 Rails 的人,还有 DBA,还有数据分析师,好的 comment 给他们带来很多便利
-
数据库字段不一定非得是 Integer
可以是 boolean(个人觉得 boolean 字段已经没有必要使用 enum 了,毕竟语意已经很明确了)
还可以是 string,在对一些老代码做重构的时候,这个特性可能会很实用 -
结合 I18n 食用,风味更佳
针对 enum 的 i18n 方案有很多,比如
enum_i18n / human_enum / active_record-humanized_enum
这三个很相似,都是把翻译写在 zh-CN.activerecord.attributes.conversation.statuses
下面,只是调用方式略微有点不同
它的翻译写在 zh-CN.enums.conversation.status
下面,相比起来更直观一点,而且它支持 simple_form,个人比较推荐
如果你不怕麻烦,也不想引入任何 gem,还可以利用 human_attribute_name
来实现:
# zh-CN.yml
# zh-CN:
# activerecord:
# attributes:
# conversation/status:
# active: 当前激活
# waiting: 等待中
# archived: 已归档
conversation.status # => "active"
Conversation.human_attribute_name("status.#{conversation.status}") # => "当前激活"
- enum 的字面量要注意避开 model 已有的method_names/attribute_names
参考:
https://ruby-china.org/topics/28654
https://api.rubyonrails.org/v5.1/classes/ActiveRecord/Enum.html