MonarchBase - Protein-coding gene

DPOGS204282
Transcript	DPOGS204282-TA	3210 bp
Protein	DPOGS204282-PA	1069 aa
Genomic position	DPSCF300046 + 100970-112712
RNAseq coverage	8071x (Rank: top 2%)

Annotation
*Heliconius*	HMEL003312	0.0	48.27%
*Bombyx*	BGIBMGA007558-TA	7e-154	47.54%
*Drosophila*			%
EBI UniRef50	UniRef50_D6WKI9	4e-79	42.40%	Putative uncharacterized protein n=3 Tax=Tribolium castaneum RepID=D6WKI9_TRICA
NCBI RefSeq	XP_973726.1	1e-94	36.15%	PREDICTED: similar to inter-alpha (globulin) inhibitor H4 (plasma Kallikrein-sensitive glycoprotein) [Tribolium castaneum]
NCBI nr blastp	gi\|47218988	4e-100	34.33%	unnamed protein product [Tetraodon nigroviridis]
NCBI nr blastx	gi\|47218988	7e-101	34.20%	unnamed protein product [Tetraodon nigroviridis]

Group
Gene Ontology	GO:0005515	4.8e-14	protein binding
KEGG pathway
InterPro domain	[40-170] IPR006587	1.7e-34	Vault protein inter-alpha-trypsin, metazoa
	[55-170] IPR013694	3.4e-33	Vault protein inter-alpha-trypsin
	[453-697] IPR002035	4.8e-14	von Willebrand factor, type A
Orthology group	MCL11007		Patchy

Nucleotide sequence:

>DPOGS204282-TA
ATGAAGAAATCCTGGATATACCTGTTTTACATAGTTTTTATCGTTGCAAAAGCACAAACCGCCTCAATTTCTAGCACCGAAACTTTGGTTGTTGCCAAGACAGATGATGAGGCGTCAACGGCTGCTCCGTCTGAACCAGTAACCGACGAACCAAACGCTCCTATCAAAGTGACAGAAATGAGAGTTAATTCGGAGGTGACGATGCGGTACGCACATACAGCTGTTGTCACACACGTCAGAAACCCAGCTTCCAAAGCACAGGAGGCAACCTTCCATGTGCTGTTGCCAGAGACAGCCTTCATCAGCGGCTTCATAATGACGTTGGGCGGGAAATCGTATAAGGCTTACGTAAAAGAAAAAAATGAAGCGAAACAAATTTTCAACGAAGCTGTCTCTCACGGGACTGGGGCGGCCCACATCGCGGCCAAAGCTCGTGATTCAAACCATTTCACAGTATCAGTGAATGTGGAGCCGAAGAGTGTTGCTATATTCAATCTGACCTATGAAGAGTTATTGGTGCGTCGCAACGGCGTTTACAACCACGCAATCAACCTTCACCCGGGAACCTTAGTACCCAAGCTGGAGGTGGTGGTACACATCAAGGAGTCCCAGAAGATCACGACGCTCCGAGTGCCTGAGGTCAGGACTGGCAATGAAATCGATGCTACAGAAAACGACGCACAAAATTCAAAGGCTGTCCAAACTAGAAATGGCGACAAGGAAGCTACCATTACATTCACGCCCGACTTGGACGAACAGATGAACCTTATTAAGATATATAAGGACAAAACAAAAGATACCGTGGCACATCATTATTGGGACAACAATGAGGAAGAAGACAACAGAGACGGAGTTTTGGGACAATTTGTTGTTCAATACGACGTGGAACGTTCGAACGATGGAGAAGTCTTGGTGAATGATGGATATTTTGTGCACTTCCTGGCACCCAGCTCGTTGCCACCACTCAACAAGTACGTGGTATTTGTGCTGGACACTTCCAGCTCTATGATCGGTCGCAAGGTGGAACAATTGATTGCAGCTATGGACGCCATACTGTCCGACCTCAACCCGAAAAATTCGAAGGCTGTCCAAACTAGAAATGGCGACAAGGAAGCTACCATTACATTCACGCCCGACTTGGACGAACAGATGAACCTTATTAAGATATATAAGGAAAAAACAAAAGATACCGTGACACATCATTATTGGGACAACAATGAGGAAGAAGACAACAGAGACGGAGTTTTGGGACAATTTGTTGTTCAATACGACGTGGAACGTTCTAACGATGGAGAAGTCTTGGTGAATGATGGATATTTTGTGCACTTCCTGGCACCCAGCTCGTTGCCACCACTCAACAAGTACGTGGTATTTGTGCTGGACACATCCAGCTCTATGATCGGTCGCAAGGTGGAACAATTGATCGCAGCTATGGACGCCATACTGTCGGACCTCAACCCGAGTGATTACTTCAGCATTGTTGAATTTAACTCCGACTACTCGGTCCATGAGCTGAAAGAAGCGGATGAGCCTCAACCTGAACCTCAAAAGTTTTCTTGGTATGGATCAACGTCATCATCAAACAAGGAACTTGTCTCACCATCACTTGCTTCACCTGAGAACATCGCTAAGGCCAAGGTTATCATTTCCAGATTACGGGCTAATGGAGGAACCAATATCCACAGCGCTTTGAGCGTAGCTATGGATCTTATTCATAAGTTCTCTGGAAAGCACGATATTTCTTCTGAAAAATCGAATTCAAGTGACGCTGCAAACGAAAAAGCGATAGCAAATGCTAACGACTTGAAAACCAAACCAGTCCATGAATTGGAGCCCATCATTATTTTCCTGACGGACGGCGACCCGACCGTCGGAGAGACCAGCACCTCGCGTATCATCTCACACGTCACCGAGAAGAACTCCGGAGAAATGAGGGCTTCCTTGTTCTCACTTGCTTTCGGTGAGGATGCGGATCGCAACTTCTTGAGAAAGCTATCACTGCGTAACGAAGGCTTCATGCGGCACATCTACGAGGCGGCGGATGCGGCGCTTCAGCTGAGAGACTTCTACAAACAGGTCTCCTCTCCACTGCTGGCTCACGTCAAGTTCACATACCCACGGGAACAGATAAAAGAGGGTTCAGTTAGTAAGAACAAGTTCCGCACCGTGTACGCGGGTTCAGAGGTAGTAGTGGCTGGGGAGCTCTCTGACGACGACGTTGATTTGAGACCTGTCGTTAGTGGCTTCTGCGGGAACCAAAATGGAAAATTGATTCCATATGAAAATGATCAGTCCAAGATCAAAGTCACTCGCGTGAAGGAGTTCTTACCTCTGGAGCGCCTGTGGGCGTACCTGAGTATCCATCAGCTATTGGACCAACGTGACGCCTCCGAAGATACAGCCGCCAAAGAGCATGAGAAGAAAGCACTCAATTTAGCGCTGAAGTACTCGTTCGTGACTCCCCTAACGTCGTTGGTGGTGGTAAAGCCGAACGAAACGAACGCCGTGGACGCTGAATCTGTAGACAAAAATAACAACACACTGTCGTTTAATGCAATGCCTCAAGCGCCTTTAAGTCATCATTTATTGATAGCACCACCAGCGTACAGACCCATGGTTATGGGTGGGAATGGAGACGCACTCGCGTTGGTAGGAGGTTTCCATGCTCAAGTAGAAGACGAGGAGGTCGACGAAAAATATGACGACATTGGCCAGATCAGTCTCAACAGAGCTGGTTACAGATTCGATTCAGACGAGGACGATTATGATGGCTTTATAGGTTCAAGTTCATTTATTACAACACCAGCACCAGTGCAGGACTTTTTTGAAACTGTCGCTACCGAAGTCCCAGATCAGGACAAATACCATTTAGAGAACTACATGTGGGCTTTAGCTTTAGTGAACAACACCGCTGACGCCCTCGTGTTTATGGATAATGGAACCGAAATCGTTTTACAGCTCTCTAAAGATAGTAATGCTCCTCGTGGTAGCTCTGAGGAGTCCTGCACGAACGTGCCCGTTGACGCGGCGAGCCCTGCTTCGGGCCCTGAACCCGTGAAGGCCTCCTGTGTCTATATCACTCGCTGTTCCGCAGCCAGGAACATCACCGAAGATGACTATCGCAGATCATACTGTCGCGTTGACAACAAATACGCTGGTGTTTGCTGCCCGAGTAGCCAAATAGACACCGAAGTGCTACCTCTTATCTAA

Protein sequence:

>DPOGS204282-PA
MKKSWIYLFYIVFIVAKAQTASISSTETLVVAKTDDEASTAAPSEPVTDEPNAPIKVTEMRVNSEVTMRYAHTAVVTHVRNPASKAQEATFHVLLPETAFISGFIMTLGGKSYKAYVKEKNEAKQIFNEAVSHGTGAAHIAAKARDSNHFTVSVNVEPKSVAIFNLTYEELLVRRNGVYNHAINLHPGTLVPKLEVVVHIKESQKITTLRVPEVRTGNEIDATENDAQNSKAVQTRNGDKEATITFTPDLDEQMNLIKIYKDKTKDTVAHHYWDNNEEEDNRDGVLGQFVVQYDVERSNDGEVLVNDGYFVHFLAPSSLPPLNKYVVFVLDTSSSMIGRKVEQLIAAMDAILSDLNPKNSKAVQTRNGDKEATITFTPDLDEQMNLIKIYKEKTKDTVTHHYWDNNEEEDNRDGVLGQFVVQYDVERSNDGEVLVNDGYFVHFLAPSSLPPLNKYVVFVLDTSSSMIGRKVEQLIAAMDAILSDLNPSDYFSIVEFNSDYSVHELKEADEPQPEPQKFSWYGSTSSSNKELVSPSLASPENIAKAKVIISRLRANGGTNIHSALSVAMDLIHKFSGKHDISSEKSNSSDAANEKAIANANDLKTKPVHELEPIIIFLTDGDPTVGETSTSRIISHVTEKNSGEMRASLFSLAFGEDADRNFLRKLSLRNEGFMRHIYEAADAALQLRDFYKQVSSPLLAHVKFTYPREQIKEGSVSKNKFRTVYAGSEVVVAGELSDDDVDLRPVVSGFCGNQNGKLIPYENDQSKIKVTRVKEFLPLERLWAYLSIHQLLDQRDASEDTAAKEHEKKALNLALKYSFVTPLTSLVVVKPNETNAVDAESVDKNNNTLSFNAMPQAPLSHHLLIAPPAYRPMVMGGNGDALALVGGFHAQVEDEEVDEKYDDIGQISLNRAGYRFDSDEDDYDGFIGSSSFITTPAPVQDFFETVATEVPDQDKYHLENYMWALALVNNTADALVFMDNGTEIVLQLSKDSNAPRGSSEESCTNVPVDAASPASGPEPVKASCVYITRCSAARNITEDDYRRSYCRVDNKYAGVCCPSSQIDTEVLPLI-

Monarch geneset OGS2.0

Nucleotide sequence:

Protein sequence: