BioInformatics - Myanmar
Contact information, map and directions, contact form, opening hours, services, ratings, photos, videos and announcements from BioInformatics - Myanmar, Education, No 9/451, Maymyo.
21/10/2021
How do you build a cell? Scientists from Delft University of Technology have proposed a potential strategy, utilizing a system-level evolutionary approach, in Frontiers in Bioengineering and Biotechnology.
Find out more about the bottom-up construction of an artificial living cell here ⬇
https://fro.ntiers.in/hgdJ
Summer School on Machine Learning in Bioinformatics record file Part2
Summer School on Machine Learning in Bioinformatics record file Part1
13/08/2021
Overview of Sequencing Data Analysis and Adapter Trimming Design
sequencing ျပဳလုပ္သည့္အခါ sequence data ေတြကို fragment အပိုင္းေလးေတြျပဳလုပ္ၿပီး adapter ကပ္ၿပီးမွာ sequencing စက္ကေန sequence data ဖတ္တယ္။အဲလိုဖတ္တဲ့အခါ sequence data ေရာ adapter ေရာကို Fastq file အေနနဲ႔ စက္ကေနထုတ္ေပးပါတယ္။ ရရွိလာတဲ့ Fastq file ထဲက Fragment ေတြပါဝင္တဲ့ adapter ေတြကိုဖယ္မွသာလိုခ်င္တဲ့ sequence data ကိုရရွိၿပီး Analysis ျပဳလုပ္နိုင္မွာပါ။ အဲဒီလို adapter ေတြကို ဖယ္ထုတ္ျခင္းကို trimming ျပဳလုပ္တယ္လိုေျပာၾကပါသည္။ trimming ျပဳလုပ္တဲ့အခါ sequencing ျပဳလုပ္တဲ့အေပၚမူတည္ၿပီး adapter ေတြကို remove ျပဳလုပ္ရပါမယ္။ sequence ျပဳလုပ္သည့္အခါ single-end sequencing နဲ႔ paired-end sequencing ဆိုၿပီး ျပဳလုပ္ၾကပါသည္။ single-end sequencing ဆိုရင္ ေတာ့ forward fastq file က တစ္ခုပဲထြက္လာၿပီး paired-end sequencing ဆိုရင္ေတာ့ forward and reverse file ႏွစ္ခုထြက္လာပါသည္ (ဉပမာ 4_S1_L001_R1_001.fastq, 4_S1_L001_R2_001.fastq ) ။ Covid DNA sequencing ကို paired-end sequencing ျဖင့္ျပဳလုပ္သည့္အခါ ထြက္လာသည့္ file size က ႏွစ္ခုေပါင္း 300 mb ေလာက္ရွိပါသည္။ sequence base pair(TTTTGTTACTTAT) ေပါင္း million နဲ႔ ရွိပါတယ္။ million ေလာက္ရွိသည့္ sequence data ေတြထဲက ေရာေနတဲ့ adapter ေတြကို ဖယ္ထုတ္ဖို့ဆို ရင္ fragment sequence data ေတြနဲ႔ adapter ေတြ တည္ေဆာက္ပုံကို နားလည္းဖို့လိုပါတယ္။ ေအာက္ပါတြင္ ပုံမ်ားျဖင့္ေဖာ္ျပေပးထားပါတယ္။
10/08/2021
AI (Convolutional Neural Network ) ကိုအသုံးပြုပြီး DNA sequence ကို prediction ပြုလုပ်ဖို့ဆိုရင် Convolutional Neural Network ကို အသေးစိတ်နားလည်းဖို့လိုအပ်ပါသည်။
Convolutional Neural Network (CNN) Theory အပြည့်အစုံ pdf file ကို အောက် ဖော်ပြပါလင့်တွင် download ပြုလုပ်နိုင်ပါသည်။
https://u.pcloud.link/publink/show?code=XZCQnwXZ1BauuGKJtljc0acPooqwG537jOFX
01/08/2021
DNA sequence with CNN Convolutional Neural Network
Prediction of COVID-19 with Deep Learning (Research Project)
Covid-19 sequence data ကို Deep learning ျဖစ္ျဖစ္ machine learning ျဖစ္ျဖစ္ research ျပဳလုပ္ျခင္း ္သူမ်ားအတြက္
1. Alpha
2. Beta
3. Delta
4. Eta
5. Gamma
6. Iota
7. Kappa
8. Lambda
9. Unknow
class 9 ခုပါၿပီး data file ကို ေအာက္ေဖာ္ျပ လင့္တြင္ download လုပ္နိုင္ပါတယ္။
https://u.pcloud.link/publink/show?code=XZessxXZsKBzlgJ1R7RkVDWE8DKod78PBzHV
ဒါမွမဟုတ္ ကိုယ္တိုင္ data file ကို create လုပ္ခ်င္းသူမ်ားအတြက္ ေအာက္ေဖာ္ျပပါတြင္ python code ကို ေလ့လာနိုင္ပါတယ္
from Bio import SeqIO
from os import getcwd
import os
import pandas as pd
path = 'CovidData/'
savefolder=''
i=1;
dataset=os.listdir(path)
data=[]
classes = []
for foldername in dataset:
fileos=os.listdir(path+foldername)
classes.append(foldername)
for file in fileos:
filepath=os.path.join(path,foldername,file)
for seq_record in SeqIO.parse(filepath, "fasta"):
DNA = seq_record.seq
data.append((i, DNA))
print(filepath+"-Class"+"-"+"-"+str(i))
i+=1
print("create data")
print(classes)
df = pd.DataFrame(data, columns=["Class", "Sequence"])
df.to_csv("conviddata.csv")
df.to_csv("convidata.txt",sep='\t',index=Flase)
with open('classes.txt', 'w') as f:
f.write('\n'.join(classes))
About FASTQ Format
Bioinformatic မှာ ဇီဝဗေဒဆိုင်ရာအချက်အလက်များကို လေ့လာဖို့အတွက် DNA sequencing နည်းပညာက အရမ်းအရေးပါတဲ့ နည်းပညာတစ်ခုဖြစ်ပါသည်။ အခုဆိုရင် Covid ဗီဇ မျိုးကွဲတွေကိုလေ့လာတဲ့အခါမှာ DNA sequencing နည်းပညာကို သုံးပြုပြီး လေ့လာကြရပါတယ်။
Covid DNA sequencing ပြုလုပ်သည့်အခါ စက်မှထွက်လာသည့် Raw Data သည် FASTQ Format ဖြင့်ထွက်လာပါသည်။ sequence ပြလုပ်သည့်အပေါ်မူတည်ပြီး single-end sequencing ဆိုရင် တော့ forward fastq file က တစ်ခုပဲထွက်လာပြီး paired-end sequencing ဆိုရင်တော့ forward and reverse file နှစ်ခုထွက်လာပါသည် (ဉပမာ 4_S1_L001_R1_001.fastq, 4_S1_L001_R2_001.fastq ) ။ Covid DNA sequencing ကို paired-end sequencing ဖြင့်ပြုလုပ်သည့်အခါ ထွက်လာသည့် file size က နှစ်ခုပေါင်း 300 mb လောက်ရှိပါသည်။ sequence base pair(TTTTGTTACTTAT) ပေါင်း million နဲ့ ရှိပါတယ်။ Fastq format က nucleotide sequence တွေကို computer မှာ text base ဖြင့်သိမ်းဆည်းထားတာပါ။
Fastq Format မှာ nucleotide sequence တစ်ခုကို လိုင်း (၄)ခုဖြင့်သတ်မှတ်ထားပါသည်။
:1:000000000-JDTF6:1:1101:14880:1500 2:N:0:5
TTTTGTTACTTATAACCTCTGGAACACTTTTACAAGACTTCAGAGTTTAGATAATGTGGCTTTTAATGTTTTAAATAATGGACACTTTGATGGACAACAGGGTGAAGTACCAGTTTCTATCATTAATAACACTGTTTACACAAAAGTTGAT
+
1>>A11B33BD3B33B1BAF1111A00BFGF3B3110ABED2121DDF211221D2D21/BFGH21B2BD2A211D212211B1BFFG12D210B10>/0//B//11B2@121BGG2G2FG2FFD1F2211BF1GHHBEBD1?000BG12F
လိုင်း(၁)က sequence identifier သတ်မှတ်ထားပါသည်။
လိုင်း(၂)က sequence ပါ ။
လိုင်း(၃)က + တစ်ခုပဲရှိပါတယ်။ အဲဒီနောက်က လာမည့်လိုင်းက sequence တစ်လုံးချင်းရဲ့ Quality Scores ဖော်ပြပေးထားတာပါ။
လိုင်း(၄) က လိုင်း (၂) ထဲမှာရှိသည့် sequence တစ်လုံးချင်းရဲ့ Quality Scores ကိုဖော်ပြပေးထားတာပါ။
Yan Naing Soe
Click here to claim your Sponsored Listing.
Location
Category
Contact the school
Telephone
Website
Address
No 9/451
Maymyo
55343