parent
77c0645acf
commit
8c73137ffd
@ -29,8 +29,10 @@ Provide soundex calculation
|
|||||||
# Standard python modules
|
# Standard python modules
|
||||||
#
|
#
|
||||||
#-------------------------------------------------------------------------
|
#-------------------------------------------------------------------------
|
||||||
import string
|
import sys
|
||||||
import unicodedata
|
import unicodedata
|
||||||
|
if sys.version_info[0] < 3:
|
||||||
|
import string
|
||||||
|
|
||||||
#-------------------------------------------------------------------------
|
#-------------------------------------------------------------------------
|
||||||
#
|
#
|
||||||
@ -38,8 +40,12 @@ import unicodedata
|
|||||||
#
|
#
|
||||||
#-------------------------------------------------------------------------
|
#-------------------------------------------------------------------------
|
||||||
IGNORE = "HW~!@#$%^&*()_+=-`[]\|;:'/?.,<>\" \t\f\v"
|
IGNORE = "HW~!@#$%^&*()_+=-`[]\|;:'/?.,<>\" \t\f\v"
|
||||||
|
if sys.version_info[0] < 3:
|
||||||
TABLE = string.maketrans('ABCDEFGIJKLMNOPQRSTUVXYZ',
|
TABLE = string.maketrans('ABCDEFGIJKLMNOPQRSTUVXYZ',
|
||||||
'012301202245501262301202')
|
'012301202245501262301202')
|
||||||
|
else:
|
||||||
|
TABLE = bytes.maketrans(b'ABCDEFGIJKLMNOPQRSTUVXYZ',
|
||||||
|
b'012301202245501262301202')
|
||||||
|
|
||||||
from .constfunc import conv_to_unicode_direct
|
from .constfunc import conv_to_unicode_direct
|
||||||
|
|
||||||
@ -55,9 +61,14 @@ def soundex(strval):
|
|||||||
conv_to_unicode_direct(strval.upper().strip())).encode('ASCII', 'ignore')
|
conv_to_unicode_direct(strval.upper().strip())).encode('ASCII', 'ignore')
|
||||||
if not strval:
|
if not strval:
|
||||||
return "Z000"
|
return "Z000"
|
||||||
strval = strval.encode('iso-8859-1')
|
if sys.version_info[0] < 3:
|
||||||
|
strval = strval.encode('iso-8859-1') # Really?
|
||||||
str2 = strval[0]
|
str2 = strval[0]
|
||||||
strval = strval.translate(TABLE, IGNORE)
|
strval = strval.translate(TABLE, IGNORE)
|
||||||
|
else:
|
||||||
|
strval = strval.decode('ASCII', 'ignore')
|
||||||
|
str2 = strval[0]
|
||||||
|
strval = strval.translate(TABLE)
|
||||||
if not strval:
|
if not strval:
|
||||||
return "Z000"
|
return "Z000"
|
||||||
prev = strval[0]
|
prev = strval[0]
|
||||||
|
Loading…
Reference in New Issue
Block a user