假设我有一个名为movie_celebrity的表,其中包含以下列:
CREATE TABLE `movie_celebrity` (
`id` int(11) NOT NULL,
`movie_id` int(11) NOT NULL,
`celebrity_id` int(11) NOT NULL,
`movie_celebrity_type_id` int(11) NOT NULL,
`role` varchar(10) DEFAULT NULL,
`character_name` varchar(50) DEFAULT NULL
)
因此,如果名人的类型是作家或导演,则字段role
和character_name
将为空,仅当类型为actor时才会填充此字段。
这是一个非常糟糕的设计吗?或者这只是效率稍低? 我认为为这两列创建一个单独的表会更好。
编辑(包括架构)
电影表:
CREATE TABLE `movie` (
`id` int(11) NOT NULL,
`name` varchar(100) NOT NULL,
`poster` varchar(255) DEFAULT NULL,
`release_Date` date NOT NULL,
`runtime` time NOT NULL,
`storyline` text NOT NULL,
`rated` varchar(10) DEFAULT NULL,
`rating` float(2,1) NOT NULL DEFAULT '0.0',
`inserted` timestamp NOT NULL DEFAULT CURRENT_TIMESTAMP
)
名人表:
CREATE TABLE `celebrity` (
`id` int(11) NOT NULL,
`name` varchar(100) NOT NULL,
`picture` varchar(255) DEFAULT NULL,
`date_of_birth` date NOT NULL,
`biography` text NOT NULL
)
Movie_Celebrity表:
CREATE TABLE `movie_celebrity` (
`id` int(11) NOT NULL,
`movie_id` int(11) NOT NULL,
`celebrity_id` int(11) NOT NULL,
`type` varchar(10) NOT NULL,
`role` varchar(10) DEFAULT NULL,
`character_name` varchar(50) DEFAULT NULL
)
看来你正试图组合一个“演员和工作人员”表。根据你正在做的事情,将它们全部合并在一个表中可能是一个好主意,或者最好有单独的“演员”和“工作人员”。我会说从一个组合表开始看看它是怎么回事。如果它不起作用,您可以拆分表和create a view以实现向后兼容。
根据作者的评论,movie_celebrity_type_id
用于“作家”或“演员”或“导演”之类的东西,而role
则用于“领导”或“支持”。这看起来很奇怪。许多电影没有定义“领先”与“支持”演员。许多名人都是目录,作家,演员和制片人。阿尔弗雷德希区柯克就是一个很好的例子。
你的movie
和celebrity
表很好,但我可能只是称它们为persons
。我设计连接它们的表如下:
create table cast_and_crew (
id integer primary key auto_increment,
movie_id integer not null,
celebrity_id integer not null,
role text not null,
character_name text,
credited boolean not null default true,
notes json not null default '{}'
foreign key(movie_id) references movie(id),
foreign key(celebrity_id) references celebrity(id),
-- Include the character name for people who act in more than one role
unique(movie_id, celebrity_id, role, character_name)
);
这不仅仅是一个电影/名人联接表,所以我给它一个描述性名称cast_and_crew
。由于其他绝大多数参赛作品都是character_name
的演员,因此可以将其作为一个真正的专栏。 notes
JSON column为任何其他数据位提供灵活性,而无需添加更多列。
例如,阿尔弗雷德希区柯克在The Birds的无名表现......
insert into cast_and_crew (movie_id, celebrity_id, role, character_name, credited)
values(<The Birds>, <Alfred Hitchcock>, 'actor', 'Man Walking Dogs Out of Pet Shop', false);
<The Birds>
和<Alfred Hitchcock>
是他们各自的ID。
然后又作为制片人和导演。
insert into cast_and_crew (movie_id, celebrity_id, role)
values(<The Birds>, <Alfred Hitchcock>, 'producer');
insert into cast_and_crew (movie_id, celebrity_id, role)
values(<The Birds>, <Alfred Hitchcock>, 'director');
而Alfred Hitchcock的助手Peggy Robertson可能会像这样利用notes
专栏。
insert into cast_and_crew (movie_id, celebrity_id, role, noes)
values(<The Birds>, <Peggy Robertson>, 'assistant', '{ "to": <Alfred Hitchcock> }');
可以编写使用此表的代码以基于角色实例化子类。例如,您可以编写一个通用的CastAndCrew
类。然后CastAndCrew::Actor
子类将提供name
方法并要求它被定义。 CastAndCrew::Assistant
会知道在to
寻找一个notes
场。
另一个例子是Ray Berwick被誉为“鸟类训练师”。你可以放入role = 'trainer of the birds'
,但如果你想搜索所有的动物训练师怎么办?你可以有verbatum和normalized角色,verbatum角色是“鸟类训练师”,标准化角色是“动物训练师”。取决于你想要完成的事情。
可能会有更多改进,但它们依赖于知道您想要对数据做什么。