UCADceraas BIOINFORMATICS
Sesamum indicum Genetic Discovery Database (SiGeDiD)
Gene ID
LG
mRNA sequence
Peptide sequence
function predicted
SIN_1023974

2

+ ATGGCCGCAGCGGAGCAGCCCCTGAAAAAGCGAAAGTTACAAGAACCGCC ACCTCCGAAATCTCCGCCGACCACCGCCACGCCACCTCCGCCGCCGACAG AACCACCTACACAACCTTCGCAGCCGCACACGCCTCCGCGGTTGTCTCAG GAAGAAATCTTGCGAAGGCGCAGAAGCCAAGAAGAAATTCGGAATGTTTT TGAGTGCTATAAGAGAATAAAATTCTGCATCGGTCAGAAGGATAAGCGTT TTATGCCGGAACTGGAAGAAGCCTATCTCTCTCTCATCACGGCCGCTAGA GGTGGACTATGTGTACAACGTCTAGTGGCAGAGCACATACCGCACTATGC ATCATATTGTCCAACTGCACTTGAAGCTGCAGCAAATGTTGTAACAAGTA TGTATAATCGGTGCTTCGCATTGATAAGTAGGGGAGAAGACATTGATGGT ATTCCTTTTGAGACTGCTAAGACCTGCATATTAGGTCTAGTTGATATCTG CCAGGCTGCTTCTTCTGTGGCCTCAACTTCAGCAGTTATTCAAGGGATAT GTTCTGCAGTTTTTCTTCATGTTTTTACTTTTCTCGTGTCCTCTTTCGAG GGAAAGGATATCTTTGGTATTATTGACTGGAGAGTCCTGAGAATTTATGA AGTTGCAGAATCGTTTTCTGATTTTAAGCGCGAGTTTTTGGAGGAAGATA ATTCTGTGTTATTCAAATTGTCTAAGTTGCATGCACTAAGTTTTTTGAGG ATTTTCTTCAGTTGTCCTAAAGATTCACTTATTGCTTGCTTTGAAATCTT TAACTCCACTGGAAAGGAGGGGGCACAGAAAGGAAATTACTTTCTTCGCC AGTTGACAATTGAACTGAATGATATTGGTACTCATCGTGTGGATGAGGGA TGTGCTGAATCATCCATTCAATCTAGCAGAACAGAAGGTGATGAGAAGCA GCCTACTAACAGCTGTCCTCTATCAAAGGGAAATTCTTTTTCAAATAGTA CACCAGCAGTAATAAAGAATTGCTTGTTAGGACTGGTTCTTAATAGAGAT CCAACGCTCAAAAGTTTGATTTTTTCAAGATACAGGATGCTTTGCGATTC TGCATCTGCTGAAGTCGTTTCTGACATTACATCTGTTCTAGAAGAAGTAT TTGAATCTTTTATTCTACAAGTTAAGGCAGAAGACCGTCAAGTAGATGGT GCTGAGGGTACTCCTTTTTCATCTCAATATGTGAATCAGTACTTGGTTTC TAGAATATCTAATAAGCTAGGATCTCCTTCTGTAGTTTCAGGGAGAGATT GTCCACAGAAGCTTTCAGGCATCCATTTGAAAAAAGGTAGCACACAAATC AATGCTGGGGTTGATCCTTTTGATGGAGAATCAAAGTCGATGGATTCTCA TTATGGGGATCCTGGAGATCATTCCAATGCCAAAACGTTCATGCCTAGGG AATTGTTGAACCGACAGTCTTTCTCACCCAGAACGAGAGCGCCGCGGGAT TTCAGAAGCAACTCATTTAATGGTAGAAGCCATTCTACCCAGGTAGAGAG GAGTCCAATTCCGAATATCGACCAACCTATACCTGCTCTAAGATCCTCCA CTGAAGCTGCAAATTCTCCTTTTGAATCTCCAAAGCAAAATATTCCTCCT CCTCATTCATCAACCCACCATGCAATATGGTACTCTGATGGAGACCCTGC TGCAATGGATATCTTTCCAGCTTCAAAACAACTCTGGCTGGGGTCATTAG GTCCTGATGCATCTGAAATGCTTATTAGGTTTCAGTTTGAGAAGTTTGGT CCTATAGATCAATTGCGATATTTTCCATTTAAAGGATTTGCTACTATTGA GTATAGAAATATTATGGATGCTTTGAAAGCTAGGGAACTAATGCGGGGGC GTTCCCCTTGGGGTGCCTGCCTACGGATAAAGTTTTTGGATACAGGATTA GGAACAAGAGGAGCTATAAATGGTATTGCTGTTGGTTCTAGTTGCCATGT TTATGTTGGAAATGTTTCAAGCAAATGGGCAAAGGATGAGATGATGCATG AAGTTAAGAAAGTACTTCACAAGGGCCCTCGCACGGTCATTGATCTTAGT AGTGAAGGTGCATTATTGATGGAATTTGATGCACCTGAAGAAGCTGCCAT TTCAATAGCTCATCTACGGTGGCATCGCAAGGAAAATAGTAATTTTTTCC CACCTCCCTCCAACTTAGGTCCAGCTAATGTAATGATGCATGCTGAAGGT GCAAGGCCTTCTCCTGCTTCAGTTCATGTTGATACGAGAAACAATTTCCC TGCTAATAGCATGATTGGATCACCTCATGGTCAGACTTTGATAGAGAAGC CTCCTGAGAATTATTTGACAAGGACATCGGGATTGTCTTCATTGCTTCAA CAGTTACGTGCAAAGTATAATCTCACTCACCCCCAAGGTTCTTTTGAGAA TCATGCGCATGGTGCTCCAATGTGGGAACATGAACGAGCACCAACAAACA CACTTTGGATTAATATTCCAAATATAAGCCCCTCGTGTATCACTGATGAT GAGCTTTTGGCTGTTTGCAACATTGCAATCAATAAAACTGGATCTGTTGT CAGGATGAGTAGAACAAGTATGCCAAGAGGTTCTTATTGGGTTATTGAAT GTAGCAGCACAGATACAGCAAATACTTTATTGAAGAATTTACGAGACTGT CCTGGGATTTTCTTCCAGATAGAATTCAGAAATCCTGCAAACCCCCACGT CACAACTCCCTCAGTAAGACCAGATAGCAGTTCTCTGGAACTTACATCAC CAAGAATAAGTCAGGAACATTGTGGGTCTATGATGCAAAGTGCGAACCCT TTCCAGTCAACTTGGACTGCTGGAGGAATTGTGGAAATTGGAAGAAGTGG TACAACTGAACAATCATGGGTGTATGGAAAACCTGAAAGTGGAATACATC CTGGAGTAAGCATTGCATCCATATCTAAAACTCCAGGACCATCTATTACA CCACAGCAGCCGATTCAAGCTTCTACATTCGCTCGACCTGTCTATGCACC TCCTAATAGTTTGTGGGATGCACGTGGGGTGGGTCATCATCTGCCTCCAA AGCATATTCCTTCTCCTGTAATGCCAGCTAATGCTCACGGTAATCTGCAA GGCCCGCCATTTTTACCTGCTTCTGTGACTCCATTGGCACAGATCCATGG AAGTTCTATGGCACCATATGATCAGATGTTCTCTATGCCTGTTGTCCCTC CTCCATTATCATCTTTACCACCACCTCCACCTAATTTGCCTCCTCCCTTA CCTCAGTCTGATTTCCGTCCTCCTTTGCCTCCTCAGCCTGAGTTACAGCC TCCGCTGCCTCCAACACCTCCACCTCCACCTCCACCTCCACCTCCCCCCC ATTCCCAGCCTCCTGCATTTCCTCCTCCCCCTAGTTCTCCACCCCCACCT CCTCCATCTGTAGCTGCTGATACAGAGACTAGGTCTTCCCAGCACTATCC CTGGCAAGGGATATTGAGTAAAAGTGGCGTTTACTACTGTACAATACATG CACAACGAGTGGATTCTGATATTTGCAACTACTCAAATGCTATTGTTGAG CCTGCAGAATGGCCTGCTAGGTTGGATATGACAAAACGCACTGATCTCCG GCATGTGAAATCAACATTTTCTAGTACCCCGCCTCACAGAGTGAGTGGTG AACTTGTTATGGTTGCTCTGTGTGTGTGTGTGTGTGGCTGTGCCCATGTT CATGTCTGTGTTTGTATGCAAGTCTCTGCTCCTAACGCAGTGCCTTTGGA CTTCTCATTGATTCCCTTTATGCTCTTATGTGATTGCTTGTCAAAGAATA TTCATTTTACTTGTAGTTTGTAA

standard] MAAAEQPLKKRKLQEPPPPKSPPTTATPPPPPTEPPTQPSQPHTPPRLSQ EEILRRRRSQEEIRNVFECYKRIKFCIGQKDKRFMPELEEAYLSLITAAR GGLCVQRLVAEHIPHYASYCPTALEAAANVVTSMYNRCFALISRGEDIDG IPFETAKTCILGLVDICQAASSVASTSAVIQGICSAVFLHVFTFLVSSFE GKDIFGIIDWRVLRIYEVAESFSDFKREFLEEDNSVLFKLSKLHALSFLR IFFSCPKDSLIACFEIFNSTGKEGAQKGNYFLRQLTIELNDIGTHRVDEG CAESSIQSSRTEGDEKQPTNSCPLSKGNSFSNSTPAVIKNCLLGLVLNRD PTLKSLIFSRYRMLCDSASAEVVSDITSVLEEVFESFILQVKAEDRQVDG AEGTPFSSQYVNQYLVSRISNKLGSPSVVSGRDCPQKLSGIHLKKGSTQI NAGVDPFDGESKSMDSHYGDPGDHSNAKTFMPRELLNRQSFSPRTRAPRD FRSNSFNGRSHSTQVERSPIPNIDQPIPALRSSTEAANSPFESPKQNIPP PHSSTHHAIWYSDGDPAAMDIFPASKQLWLGSLGPDASEMLIRFQFEKFG PIDQLRYFPFKGFATIEYRNIMDALKARELMRGRSPWGACLRIKFLDTGL GTRGAINGIAVGSSCHVYVGNVSSKWAKDEMMHEVKKVLHKGPRTVIDLS SEGALLMEFDAPEEAAISIAHLRWHRKENSNFFPPPSNLGPANVMMHAEG ARPSPASVHVDTRNNFPANSMIGSPHGQTLIEKPPENYLTRTSGLSSLLQ QLRAKYNLTHPQGSFENHAHGAPMWEHERAPTNTLWINIPNISPSCITDD ELLAVCNIAINKTGSVVRMSRTSMPRGSYWVIECSSTDTANTLLKNLRDC PGIFFQIEFRNPANPHVTTPSVRPDSSSLELTSPRISQEHCGSMMQSANP FQSTWTAGGIVEIGRSGTTEQSWVYGKPESGIHPGVSIASISKTPGPSIT PQQPIQASTFARPVYAPPNSLWDARGVGHHLPPKHIPSPVMPANAHGNLQ GPPFLPASVTPLAQIHGSSMAPYDQMFSMPVVPPPLSSLPPPPPNLPPPL PQSDFRPPLPPQPELQPPLPPTPPPPPPPPPPPHSQPPAFPPPPSSPPPP PPSVAADTETRSSQHYPWQGILSKSGVYYCTIHAQRVDSDICNYSNAIVE PAEWPARLDMTKRTDLRHVKSTFSSTPPHRVSGELVMVALCVCVCGCAHV HVCVCMQVSAPNAVPLDFSLIPFMLLCDCLSKNIHFTCSL

IPR000504; RNA recognition motif domain IPR012921; Spen paralogue and orthologue SPOC, C-terminal