CakePHPで開発を行っている方ならデータベースのテーブル名は複数形にすることは御存知だと思います。マニュアルにも

CakePHP のモデルに対応するテーブル名は、複数形でアンダースコア記法です。

と書かれていますからね。

 英語の複数形は中学校で基本的に「s」か「es」を付けることを習いましたが、いくつかの単語はこのルールから外れます。では、そのルールから外れる単語は何であるかは、全て把握していない人もきっと多いはず。私もその1人です。

 CakePHPではその複数形のルールから外れる単語を認識してテーブルに接続して処理をしてくれるんですが
 「なぜ、複数形の単語を認識してくれるんだろうか?」
と疑問を感じたことがないですか?そりゃあ、外人が作っているんだから単数形と複数形の単語ぐらいはわかると思いますが、いくら外人が作ったからと行っても、プログラムが何もしないで英語の単数形と複数形を認識するはずがありません。そこで、下記にCakePHPがどこで単数形と複数形を判別しているのかを調べてみました。

 CakePHP(バージョンは1.3です)のコアファイル群をチョコチョコと調べたら見つかりました。場所は

/cake/libs/inflector.php

です。このファイルを開いてみると「Inflector」というクラスが作られていてその中に

  • $_plural
  • $_singular
  • $_uninflected
  • $_transliteration

の変数が設定されています。これらのソースはちょっと長いですが下記の通りです。


class Inflector {

/**
 * Plural inflector rules
 *
 * @var array
 * @access protected
 */
	var $_plural = array(
		'rules' = array(
			'/(s)tatus$/i' => '12tatuses',
			'/(quiz)$/i' => '1zes',
			'/^(ox)$/i' => '12en',
			'/([m|l])ouse$/i' => '1ice',
			'/(matr|vert|ind)(ix|ex)$/i'  => '1ices',
			'/(x|ch|ss|sh)$/i' => '1es',
			'/([^aeiouy]|qu)y$/i' => '1ies',
			'/(hive)$/i' => '1s',
			'/(?:([^f])fe|([lr])f)$/i' => '12ves',
			'/sis$/i' => 'ses',
			'/([ti])um$/i' => '1a',
			'/(p)erson$/i' => '1eople',
			'/(m)an$/i' => '1en',
			'/(c)hild$/i' => '1hildren',
			'/(buffal|tomat)o$/i' => '12oes',
			'/(alumn|bacill|cact|foc|fung|nucle|radi|stimul|syllab|termin|vir)us$/i' => '1i',
			'/us$/' => 'uses',
			'/(alias)$/i' => '1es',
			'/(ax|cris|test)is$/i' => '1es',
			'/s$/' => 's',
			'/^$/' => '',
			'/$/' => 's',
		),
		'uninflected' => array(
			'.*[nrlm]ese', '.*deer', '.*fish', '.*measles', '.*ois', '.*pox', '.*sheep', 'people'
		),
		'irregular' => array(
			'atlas' => 'atlases',
			'beef' => 'beefs',
			'brother' => 'brothers',
			'child' => 'children',
			'corpus' => 'corpuses',
			'cow' => 'cows',
			'ganglion' => 'ganglions',
			'genie' => 'genies',
			'genus' => 'genera',
			'graffito' => 'graffiti',
			'hoof' => 'hoofs',
			'loaf' => 'loaves',
			'man' => 'men',
			'money' => 'monies',
			'mongoose' => 'mongooses',
			'move' => 'moves',
			'mythos' => 'mythoi',
			'niche' => 'niches',
			'numen' => 'numina',
			'occiput' => 'occiputs',
			'octopus' => 'octopuses',
			'opus' => 'opuses',
			'ox' => 'oxen',
			'penis' => 'penises',
			'person' => 'people',
			'sex' => 'sexes',
			'soliloquy' => 'soliloquies',
			'testis' => 'testes',
			'trilby' => 'trilbys',
			'turf' => 'turfs'
		)
	);

/**
 * Singular inflector rules
 *
 * @var array
 * @access protected
 */
	var $_singular = array(
		'rules' => array(
			'/(s)tatuses$/i' => '12tatus',
			'/^(.*)(menu)s$/i' => '12',
			'/(quiz)zes$/i' => '\1',
			'/(matr)ices$/i' => '1ix',
			'/(vert|ind)ices$/i' => '1ex',
			'/^(ox)en/i' => '1',
			'/(alias)(es)*$/i' => '1',
			'/(alumn|bacill|cact|foc|fung|nucle|radi|stimul|syllab|termin|viri?)i$/i' => '1us',
			'/([ftw]ax)es/i' => '1',
			'/(cris|ax|test)es$/i' => '1is',
			'/(shoe|slave)s$/i' => '1',
			'/(o)es$/i' => '1',
			'/ouses$/' => 'ouse',
			'/([^a])uses$/' => '1us',
			'/([m|l])ice$/i' => '1ouse',
			'/(x|ch|ss|sh)es$/i' => '1',
			'/(m)ovies$/i' => '12ovie',
			'/(s)eries$/i' => '12eries',
			'/([^aeiouy]|qu)ies$/i' => '1y',
			'/([lr])ves$/i' => '1f',
			'/(tive)s$/i' => '1',
			'/(hive)s$/i' => '1',
			'/(drive)s$/i' => '1',
			'/([^fo])ves$/i' => '1fe',
			'/(^analy)ses$/i' => '1sis',
			'/(analy|(b)a|(d)iagno|(p)arenthe|(p)rogno|(s)ynop|(t)he)ses$/i' => '12sis',
			'/([ti])a$/i' => '1um',
			'/(p)eople$/i' => '12erson',
			'/(m)en$/i' => '1an',
			'/(c)hildren$/i' => '12hild',
			'/(n)ews$/i' => '12ews',
			'/eaus$/' => 'eau',
			'/^(.*us)$/' => '\1',
			'/s$/i' => ''
		),
		'uninflected' => array(
			'.*[nrlm]ese', '.*deer', '.*fish', '.*measles', '.*ois', '.*pox', '.*sheep', '.*ss'
		),
		'irregular' => array(
			'waves' => 'wave'
		)
	);

/**
 * Words that should not be inflected
 *
 * @var array
 * @access protected
 */
	var $_uninflected = array(
		'Amoyese', 'bison', 'Borghese', 'bream', 'breeches', 'britches', 'buffalo', 'cantus',
		'carp', 'chassis', 'clippers', 'cod', 'coitus', 'Congoese', 'contretemps', 'corps',
		'debris', 'diabetes', 'djinn', 'eland', 'elk', 'equipment', 'Faroese', 'flounder',
		'Foochowese', 'gallows', 'Genevese', 'Genoese', 'Gilbertese', 'graffiti',
		'headquarters', 'herpes', 'hijinks', 'Hottentotese', 'information', 'innings',
		'jackanapes', 'Kiplingese', 'Kongoese', 'Lucchese', 'mackerel', 'Maltese', 'media',
		'mews', 'moose', 'mumps', 'Nankingese', 'news', 'nexus', 'Niasese',
		'Pekingese', 'Piedmontese', 'pincers', 'Pistoiese', 'pliers', 'Portuguese',
		'proceedings', 'rabies', 'rice', 'rhinoceros', 'salmon', 'Sarawakese', 'scissors',
		'sea[- ]bass', 'series', 'Shavese', 'shears', 'siemens', 'species', 'swine', 'testes',
		'trousers', 'trout','tuna', 'Vermontese', 'Wenchowese', 'whiting', 'wildebeest',
		'Yengeese'
	);

/**
 * Default map of accented and special characters to ASCII characters
 *
 * @var array
 * @access protected
 */
	var $_transliteration = array(
		'/ä|æ|ǽ/' => 'ae',
		'/ö|œ/' => 'oe',
		'/ü/' => 'ue',
		'/Ä/' => 'Ae',
		'/Ü/' => 'Ue',
		'/Ö/' => 'Oe',
		'/À|Á|Â|Ã|Ä|Å|Ǻ|Ā|Ă|Ą|Ǎ/' => 'A',
		'/à|á|â|ã|å|ǻ|ā|ă|ą|ǎ|ª/' => 'a',
		'/Ç|Ć|Ĉ|Ċ|Č/' => 'C',
		'/ç|ć|ĉ|ċ|č/' => 'c',
		'/Ð|Ď|Đ/' => 'D',
		'/ð|ď|đ/' => 'd',
		'/È|É|Ê|Ë|Ē|Ĕ|Ė|Ę|Ě/' => 'E',
		'/è|é|ê|ë|ē|ĕ|ė|ę|ě/' => 'e',
		'/Ĝ|Ğ|Ġ|Ģ/' => 'G',
		'/ĝ|ğ|ġ|ģ/' => 'g',
		'/Ĥ|Ħ/' => 'H',
		'/ĥ|ħ/' => 'h',
		'/Ì|Í|Î|Ï|Ĩ|Ī|Ĭ|Ǐ|Į|İ/' => 'I',
		'/ì|í|î|ï|ĩ|ī|ĭ|ǐ|į|ı/' => 'i',
		'/Ĵ/' => 'J',
		'/ĵ/' => 'j',
		'/Ķ/' => 'K',
		'/ķ/' => 'k',
		'/Ĺ|Ļ|Ľ|Ŀ|Ł/' => 'L',
		'/ĺ|ļ|ľ|ŀ|ł/' => 'l',
		'/Ñ|Ń|Ņ|Ň/' => 'N',
		'/ñ|ń|ņ|ň|ʼn/' => 'n',
		'/Ò|Ó|Ô|Õ|Ō|Ŏ|Ǒ|Ő|Ơ|Ø|Ǿ/' => 'O',
		'/ò|ó|ô|õ|ō|ŏ|ǒ|ő|ơ|ø|ǿ|º/' => 'o',
		'/Ŕ|Ŗ|Ř/' => 'R',
		'/ŕ|ŗ|ř/' => 'r',
		'/Ś|Ŝ|Ş|Š/' => 'S',
		'/ś|ŝ|ş|š|ſ/' => 's',
		'/Ţ|Ť|Ŧ/' => 'T',
		'/ţ|ť|ŧ/' => 't',
		'/Ù|Ú|Û|Ũ|Ū|Ŭ|Ů|Ű|Ų|Ư|Ǔ|Ǖ|Ǘ|Ǚ|Ǜ/' => 'U',
		'/ù|ú|û|ũ|ū|ŭ|ů|ű|ų|ư|ǔ|ǖ|ǘ|ǚ|ǜ/' => 'u',
		'/Ý|Ÿ|Ŷ/' => 'Y',
		'/ý|ÿ|ŷ/' => 'y',
		'/Ŵ/' => 'W',
		'/ŵ/' => 'w',
		'/Ź|Ż|Ž/' => 'Z',
		'/ź|ż|ž/' => 'z',
		'/Æ|Ǽ/' => 'AE',
		'/ß/'=> 'ss',
		'/IJ/' => 'IJ',
		'/ij/' => 'ij',
		'/Œ/' => 'OE',
		'/ƒ/' => 'f'
	);

   // (省略)
?>

 これを見て見ればもうわかりますね。

 「$_plural」は単数形から複数形へ変換するパターンが明記されていて、「$_singular」は単数から複数へのパターンが書かれています。「$_uninflected」は単数も複数も同じ場合の単語が書かれています。「$_transliteration」は特殊な文字を通常の英字に変換しています。

 これを見れば多少、英語がわからなくてもプログラムがわかれば、複数形はどのように変更すればいいかがよくわかりますね。ある意味、英語の単数形と複数形の辞書のようなものかな(笑)

ちょっと知っておくと便利なコアファイルでした。チャン!チャン!

【追記】
CakePHP 2の場合は下記のファイルとなります。

/lib/Cake/Utility/Inflector.php

日本人に共通する英語のミス151 [増補改訂版]

著者/訳者:ジェイムズ H.M. ウェブ

出版社:ジャパンタイムズ( 2006-12-05 )

定価:

Amazon価格:¥ 8,044

単行本(ソフトカバー) ( 208 ページ )

ISBN-10 : 4789012395

ISBN-13 : 9784789012393