Package DateHandler :: Module _Date_ru :: Class DateParserRU
[frames] | no frames]

Class DateParserRU

source code


Instance Methods
 
init_strings(self)
This method compiles regular expression strings for matching dates.
source code

Inherited from _DateParser.DateParser: __init__, invert_year, match_bce, match_calendar, match_modifier, match_quality, match_range, match_span, parse, re_longest_first, set_date

Class Variables
  modifier_to_int = {u'ок': 3, u'ок.': 3, u'около': 3, u'п': 2, ...
  calendar_to_int = {u'г': 0, u'григорианский': 0, u'е': 2, u'ев...
  quality_to_int = {u'выч': 2, u'выч.': 2, u'вычисл': 2, u'вычис...
  hebrew_to_int = {u'ав': 12, u'адар': 6, u'адар бет': 7, u'ияр'...
  islamic_to_int = {u'джумада-аль-ахира': 6, u'джумада-аль-уля':...
  persian_to_int = {u'абан': 8, u'азар': 9, u'бахман': 11, u'дай...
  french_to_int = {u'брюмер': 2, u'вандемьер': 1, u'вантоз': 6, ...
  bce = [u'до нашей эры', u'до н. э.', u'до н.э.', u'до н э', u'...

Inherited from _DateParser.DateParser: modifier_after_to_int, month_to_int

Method Details

init_strings(self)

source code 

This method compiles regular expression strings for matching dates.

Most of the re's in most languages can stay as is. span and range most likely will need to change. Whatever change is done, this method may be called first as DateParser.init_strings(self) so that the invariant expresions don't need to be repeteadly coded. All differences can be coded after DateParser.init_strings(self) call, that way they override stuff from this method. See DateParserRU() as an example.

Overrides: _DateParser.DateParser.init_strings
(inherited documentation)

Class Variable Details

modifier_to_int

Value:
{u'ок': 3,
 u'ок.': 3,
 u'около': 3,
 u'п': 2,
 u'п.': 2,
 u'перед': 1,
 u'по': 1,
 u'после': 2,
...

calendar_to_int

Value:
{u'г': 0,
 u'григорианский': 0,
 u'е': 2,
 u'еврейский': 2,
 u'и': 5,
 u'исламский': 5,
 u'п': 4,
 u'персидский': 4,
...

quality_to_int

Value:
{u'выч': 2,
 u'выч.': 2,
 u'вычисл': 2,
 u'вычисл.': 2,
 u'вычислено': 2,
 u'оц': 1,
 u'оц.': 1,
 u'оцен': 1,
...

hebrew_to_int

Value:
{u'ав': 12,
 u'адар': 6,
 u'адар бет': 7,
 u'ияр': 9,
 u'кислев': 3,
 u'нисан': 8,
 u'сиван': 10,
 u'таммуз': 11,
...

islamic_to_int

Value:
{u'джумада-аль-ахира': 6,
 u'джумада-аль-уля': 5,
 u'зуль-каада': 11,
 u'зуль-хиджжа': 12,
 u'мухаррам': 1,
 u'раби-аль-авваль': 3,
 u'раби-ассани': 4,
 u'раджаб': 7,
...

persian_to_int

Value:
{u'абан': 8,
 u'азар': 9,
 u'бахман': 11,
 u'дай': 10,
 u'исфаидармуз': 12,
 u'михр': 7,
 u'мурдад': 5,
 u'тир': 4,
...

french_to_int

Value:
{u'брюмер': 2,
 u'вандемьер': 1,
 u'вантоз': 6,
 u'дополнит.': 13,
 u'жерминаль': 7,
 u'мессидор': 10,
 u'нивоз': 4,
 u'плювиоз': 5,
...

bce

Value:
[u'до нашей эры',
 u'до н. э.',
 u'до н.э.',
 u'до н э',
 u'до нэ',
 'B.C.E.',
 'B.C.E',
 'BCE',
...