EMBL import
I am trying to follow the instructions from the Wolf tutorial and am running into an issue with the obi import.
I ran:
obi import --embl EMBL kibale/embl_refs
and the import seems to work through 9800000 entries, and then I get the error:
DEBUG /private/var/folders/c1/15vq0bls6y1d1br45m_5wvjm0000gp/T/pip-install-_c3f4t5e/obitools3_8adb6055325446cca289afec61803104/src/obiavl.c:1669:obi_create_avl, obi_errno = 20, errno = 24 : Error creating an AVL tree file DEBUG /private/var/folders/c1/15vq0bls6y1d1br45m_5wvjm0000gp/T/pip-install-_c3f4t5e/obitools3_8adb6055325446cca289afec61803104/src/obiavl.c:1013:add_new_avl_in_group, obi_errno = 20, errno = 24 : Error creating a new AVL tree in a group
Could not import sequence: {b'ID': b'OW388299', b'NUC_SEQ': b' ACCCTAACCCTACACCCTCACCACCCTACTACCCAACCCTACACCCTAACCCTAACCCTACACCCTAACCCCTAACCCTAACCCTAACCCTAACCCTACCCCTAACCCTAACCCTAACCCTAACCCCCTAACCCTAACCCTAACCCTAACCCTAACCCTAACCCTCAACCCTAACCCTAACCCTAACCCTAACCCTAACCCTAACCCTAACCCTAACCCTAACCCTAACCCTAACCCTAACCCTAACCCTAACCCTACACCCTAACCCTAACCCTAACCCTAACCCTAACCCTAACCCTAACCCTAACCCTAACCCTAACCCTAACCCTAACCCTAACCCTAACCCTAACCCTAACCCTAACCCTAACCCTAACCCTAACCCTAACCCTAACCCTAACCCTAACCCTAACCCTAACCCTAACCCTAACCCTAACCCTAACCCTAACCCTAACCCTAACCCTAACCCTAACCCTAACCCTAACCCTAACCCTAACCCTAACCCTAACCCTAACCCTAACCCTAACCCTAACCCTAACCCTAACCCTAACCCTAACCCTAACCCTAACCCTAACCCTAACCCTAACCCTAACCCTAACCCTAACCCTAACCCTAACCCTAACCCTAACCCTAACCCTAACCCTAACCCTAACCCTAACCCTAACCCTAACCCTAACCCTAACCCTAACCCTAACCCTAACCCTAACCCTAACCCTAACCCTAACCCTAACCCTAACCCTAACCCTAACCCTAACCCTAACCCTAACCCTAACCCTAACCCTAACCCTAACCCTAACCCTAACCCTAACCCTAACCCTAACCCTAACCCTAACCCTAACCCTAACCCTAACCCTAACCCTAACCCTAACCCTAACCCTAACCCTAACCCTAACCCTAACCCTAACCCTAACCCTAACCCTAACCCTAACCCTAACCCTAACCCTAACCCTAACCCTAACCCTAACCCTAACCCTAACCCTAACCCTAACCCTAACCCTAACCCTAACCCTAACCCTAACCCTAACCCTAACCCTAACCCTAACCCTAACCCTAACCCTAACCCTAACCCTAACCCTAACCCTAACCCTAACCCTAACCCTAACCCTAACCCTAACCCTAACCCTAACCCTAACCCTAACCCTAACCCTAACCCTAACCCTAACCCTAACCCTAACCCTAACCCTAACCCTAACCCTAACCCTAACCCTAACCCTAACCCTAACCCTAACCCTAACCCTAACCCTAACCCTAACCCTAACCCTAACCCTAACCCTAACCCTAACCCTAACCCTAACCCTAACCCTAACCCTAACCCTAACCCTAACCCTA [keeps going for a long time, with what look like some new lines in there]
', b'DEFINITION': b'Gibbula magus genome assembly, chromosome: 11', b'TAXID': 703304, b'organism': b'Gibbula magus'} Error raised: Problem setting a value in a column /!\ Check if '--input-na-string' option needs to be set zsh: segmentation fault obi import --embl EMBL kibale/embl_refs
I also tried: obi import --input-na-string OBI:INPUTNASTRING --embl-input EMBL kibale/embl_refs but get the same error.
I guess one option would be to unzip the STD_INV_13.dat.gz file and try to remove the problematic entry, but as the file is massive (134gb) this seems like it might take a very long time.
Any advice would be greatly appreciated and many thanks for your work on obitools. Jan