Sesamum indicum Genetic Discovery Database (SiGeDiD)

BIOINFORMATICS

Sesamum indicum Genetic Discovery Database (SiGeDiD)

Gene ID	LG	mRNA sequence	Peptide sequence	function predicted
SIN_1023974	2	+ ATGGCCGCAGCGGAGCAGCCCCTGAAAAAGCGAAAGTTACAAGAACCGCC ACCTCCGAAATCTCCGCCGACCACCGCCACGCCACCTCCGCCGCCGACAG AACCACCTACACAACCTTCGCAGCCGCACACGCCTCCGCGGTTGTCTCAG GAAGAAATCTTGCGAAGGCGCAGAAGCCAAGAAGAAATTCGGAATGTTTT TGAGTGCTATAAGAGAATAAAATTCTGCATCGGTCAGAAGGATAAGCGTT TTATGCCGGAACTGGAAGAAGCCTATCTCTCTCTCATCACGGCCGCTAGA GGTGGACTATGTGTACAACGTCTAGTGGCAGAGCACATACCGCACTATGC ATCATATTGTCCAACTGCACTTGAAGCTGCAGCAAATGTTGTAACAAGTA TGTATAATCGGTGCTTCGCATTGATAAGTAGGGGAGAAGACATTGATGGT ATTCCTTTTGAGACTGCTAAGACCTGCATATTAGGTCTAGTTGATATCTG CCAGGCTGCTTCTTCTGTGGCCTCAACTTCAGCAGTTATTCAAGGGATAT GTTCTGCAGTTTTTCTTCATGTTTTTACTTTTCTCGTGTCCTCTTTCGAG GGAAAGGATATCTTTGGTATTATTGACTGGAGAGTCCTGAGAATTTATGA AGTTGCAGAATCGTTTTCTGATTTTAAGCGCGAGTTTTTGGAGGAAGATA ATTCTGTGTTATTCAAATTGTCTAAGTTGCATGCACTAAGTTTTTTGAGG ATTTTCTTCAGTTGTCCTAAAGATTCACTTATTGCTTGCTTTGAAATCTT TAACTCCACTGGAAAGGAGGGGGCACAGAAAGGAAATTACTTTCTTCGCC AGTTGACAATTGAACTGAATGATATTGGTACTCATCGTGTGGATGAGGGA TGTGCTGAATCATCCATTCAATCTAGCAGAACAGAAGGTGATGAGAAGCA GCCTACTAACAGCTGTCCTCTATCAAAGGGAAATTCTTTTTCAAATAGTA CACCAGCAGTAATAAAGAATTGCTTGTTAGGACTGGTTCTTAATAGAGAT CCAACGCTCAAAAGTTTGATTTTTTCAAGATACAGGATGCTTTGCGATTC TGCATCTGCTGAAGTCGTTTCTGACATTACATCTGTTCTAGAAGAAGTAT TTGAATCTTTTATTCTACAAGTTAAGGCAGAAGACCGTCAAGTAGATGGT GCTGAGGGTACTCCTTTTTCATCTCAATATGTGAATCAGTACTTGGTTTC TAGAATATCTAATAAGCTAGGATCTCCTTCTGTAGTTTCAGGGAGAGATT GTCCACAGAAGCTTTCAGGCATCCATTTGAAAAAAGGTAGCACACAAATC AATGCTGGGGTTGATCCTTTTGATGGAGAATCAAAGTCGATGGATTCTCA TTATGGGGATCCTGGAGATCATTCCAATGCCAAAACGTTCATGCCTAGGG AATTGTTGAACCGACAGTCTTTCTCACCCAGAACGAGAGCGCCGCGGGAT TTCAGAAGCAACTCATTTAATGGTAGAAGCCATTCTACCCAGGTAGAGAG GAGTCCAATTCCGAATATCGACCAACCTATACCTGCTCTAAGATCCTCCA CTGAAGCTGCAAATTCTCCTTTTGAATCTCCAAAGCAAAATATTCCTCCT CCTCATTCATCAACCCACCATGCAATATGGTACTCTGATGGAGACCCTGC TGCAATGGATATCTTTCCAGCTTCAAAACAACTCTGGCTGGGGTCATTAG GTCCTGATGCATCTGAAATGCTTATTAGGTTTCAGTTTGAGAAGTTTGGT CCTATAGATCAATTGCGATATTTTCCATTTAAAGGATTTGCTACTATTGA GTATAGAAATATTATGGATGCTTTGAAAGCTAGGGAACTAATGCGGGGGC GTTCCCCTTGGGGTGCCTGCCTACGGATAAAGTTTTTGGATACAGGATTA GGAACAAGAGGAGCTATAAATGGTATTGCTGTTGGTTCTAGTTGCCATGT TTATGTTGGAAATGTTTCAAGCAAATGGGCAAAGGATGAGATGATGCATG AAGTTAAGAAAGTACTTCACAAGGGCCCTCGCACGGTCATTGATCTTAGT AGTGAAGGTGCATTATTGATGGAATTTGATGCACCTGAAGAAGCTGCCAT TTCAATAGCTCATCTACGGTGGCATCGCAAGGAAAATAGTAATTTTTTCC CACCTCCCTCCAACTTAGGTCCAGCTAATGTAATGATGCATGCTGAAGGT GCAAGGCCTTCTCCTGCTTCAGTTCATGTTGATACGAGAAACAATTTCCC TGCTAATAGCATGATTGGATCACCTCATGGTCAGACTTTGATAGAGAAGC CTCCTGAGAATTATTTGACAAGGACATCGGGATTGTCTTCATTGCTTCAA CAGTTACGTGCAAAGTATAATCTCACTCACCCCCAAGGTTCTTTTGAGAA TCATGCGCATGGTGCTCCAATGTGGGAACATGAACGAGCACCAACAAACA CACTTTGGATTAATATTCCAAATATAAGCCCCTCGTGTATCACTGATGAT GAGCTTTTGGCTGTTTGCAACATTGCAATCAATAAAACTGGATCTGTTGT CAGGATGAGTAGAACAAGTATGCCAAGAGGTTCTTATTGGGTTATTGAAT GTAGCAGCACAGATACAGCAAATACTTTATTGAAGAATTTACGAGACTGT CCTGGGATTTTCTTCCAGATAGAATTCAGAAATCCTGCAAACCCCCACGT CACAACTCCCTCAGTAAGACCAGATAGCAGTTCTCTGGAACTTACATCAC CAAGAATAAGTCAGGAACATTGTGGGTCTATGATGCAAAGTGCGAACCCT TTCCAGTCAACTTGGACTGCTGGAGGAATTGTGGAAATTGGAAGAAGTGG TACAACTGAACAATCATGGGTGTATGGAAAACCTGAAAGTGGAATACATC CTGGAGTAAGCATTGCATCCATATCTAAAACTCCAGGACCATCTATTACA CCACAGCAGCCGATTCAAGCTTCTACATTCGCTCGACCTGTCTATGCACC TCCTAATAGTTTGTGGGATGCACGTGGGGTGGGTCATCATCTGCCTCCAA AGCATATTCCTTCTCCTGTAATGCCAGCTAATGCTCACGGTAATCTGCAA GGCCCGCCATTTTTACCTGCTTCTGTGACTCCATTGGCACAGATCCATGG AAGTTCTATGGCACCATATGATCAGATGTTCTCTATGCCTGTTGTCCCTC CTCCATTATCATCTTTACCACCACCTCCACCTAATTTGCCTCCTCCCTTA CCTCAGTCTGATTTCCGTCCTCCTTTGCCTCCTCAGCCTGAGTTACAGCC TCCGCTGCCTCCAACACCTCCACCTCCACCTCCACCTCCACCTCCCCCCC ATTCCCAGCCTCCTGCATTTCCTCCTCCCCCTAGTTCTCCACCCCCACCT CCTCCATCTGTAGCTGCTGATACAGAGACTAGGTCTTCCCAGCACTATCC CTGGCAAGGGATATTGAGTAAAAGTGGCGTTTACTACTGTACAATACATG CACAACGAGTGGATTCTGATATTTGCAACTACTCAAATGCTATTGTTGAG CCTGCAGAATGGCCTGCTAGGTTGGATATGACAAAACGCACTGATCTCCG GCATGTGAAATCAACATTTTCTAGTACCCCGCCTCACAGAGTGAGTGGTG AACTTGTTATGGTTGCTCTGTGTGTGTGTGTGTGTGGCTGTGCCCATGTT CATGTCTGTGTTTGTATGCAAGTCTCTGCTCCTAACGCAGTGCCTTTGGA CTTCTCATTGATTCCCTTTATGCTCTTATGTGATTGCTTGTCAAAGAATA TTCATTTTACTTGTAGTTTGTAA	standard] MAAAEQPLKKRKLQEPPPPKSPPTTATPPPPPTEPPTQPSQPHTPPRLSQ EEILRRRRSQEEIRNVFECYKRIKFCIGQKDKRFMPELEEAYLSLITAAR GGLCVQRLVAEHIPHYASYCPTALEAAANVVTSMYNRCFALISRGEDIDG IPFETAKTCILGLVDICQAASSVASTSAVIQGICSAVFLHVFTFLVSSFE GKDIFGIIDWRVLRIYEVAESFSDFKREFLEEDNSVLFKLSKLHALSFLR IFFSCPKDSLIACFEIFNSTGKEGAQKGNYFLRQLTIELNDIGTHRVDEG CAESSIQSSRTEGDEKQPTNSCPLSKGNSFSNSTPAVIKNCLLGLVLNRD PTLKSLIFSRYRMLCDSASAEVVSDITSVLEEVFESFILQVKAEDRQVDG AEGTPFSSQYVNQYLVSRISNKLGSPSVVSGRDCPQKLSGIHLKKGSTQI NAGVDPFDGESKSMDSHYGDPGDHSNAKTFMPRELLNRQSFSPRTRAPRD FRSNSFNGRSHSTQVERSPIPNIDQPIPALRSSTEAANSPFESPKQNIPP PHSSTHHAIWYSDGDPAAMDIFPASKQLWLGSLGPDASEMLIRFQFEKFG PIDQLRYFPFKGFATIEYRNIMDALKARELMRGRSPWGACLRIKFLDTGL GTRGAINGIAVGSSCHVYVGNVSSKWAKDEMMHEVKKVLHKGPRTVIDLS SEGALLMEFDAPEEAAISIAHLRWHRKENSNFFPPPSNLGPANVMMHAEG ARPSPASVHVDTRNNFPANSMIGSPHGQTLIEKPPENYLTRTSGLSSLLQ QLRAKYNLTHPQGSFENHAHGAPMWEHERAPTNTLWINIPNISPSCITDD ELLAVCNIAINKTGSVVRMSRTSMPRGSYWVIECSSTDTANTLLKNLRDC PGIFFQIEFRNPANPHVTTPSVRPDSSSLELTSPRISQEHCGSMMQSANP FQSTWTAGGIVEIGRSGTTEQSWVYGKPESGIHPGVSIASISKTPGPSIT PQQPIQASTFARPVYAPPNSLWDARGVGHHLPPKHIPSPVMPANAHGNLQ GPPFLPASVTPLAQIHGSSMAPYDQMFSMPVVPPPLSSLPPPPPNLPPPL PQSDFRPPLPPQPELQPPLPPTPPPPPPPPPPPHSQPPAFPPPPSSPPPP PPSVAADTETRSSQHYPWQGILSKSGVYYCTIHAQRVDSDICNYSNAIVE PAEWPARLDMTKRTDLRHVKSTFSSTPPHRVSGELVMVALCVCVCGCAHV HVCVCMQVSAPNAVPLDFSLIPFMLLCDCLSKNIHFTCSL	IPR000504; RNA recognition motif domain IPR012921; Spen paralogue and orthologue SPOC, C-terminal